Frekvencija ponavljanja reči

Koliko često se ponavljaju određene reči u zadatom tekstu? Odnosno, koja od njih se najčešće ponavlja? Do odgovora na ovo pitanje može da se dođe primenom nekoliko jednostavnih tehnika, o čemu će biti više govora u tekstu koji sledi. Za početak, sa linka http://www.iib.rs/srl/bizit2018-srl/ preuzeta je kratka vest koju ćemo da analiziramo kako bismo izmerili frekvenciju ponavljanja reči. Izabrani tekst prekopiraćemo u ćeliju A1 novog radnog lista.

Prvi korak je da se pozicioniramo na ćeliju A1, a zatim da iz Data trake alata izaberemo opciju Text to Columns. Otvoriće se Convert Text to Columns Wizard. U prvom prozoru treba izabrati opciju Delimited, a zatim kliknuti na Next. U sledećem prozoru je potrebno izabrati sve znakove interpunkcije, kao i znak blanko (space). Klikom na Finish završava se prvi deo procesa čiji su rezultat sve reči koje se pojavljuju u tekstu, redom navedene u prvom redu radnog lista.

Sledeći korak zahteva da se selektuje čitav prvi red, sadržaj kopira na Clipboard, a zatim pomoću opcije za transponovanje u okviru menija Paste Special svi redovi prebace u kolonu, počevši od ćelije A3. U ćeliju A2 potrebno je upisati tekst „REČI“, a zatim obrisati čitav prvi red. Selektovati ćeliju A2 i sve druge vrednosti u prvoj koloni i pretvoriti ih u strukturiranu tabelu (CTRL+T). Ako ste sve uradili kako treba rezultat je tabela sa jednom kolonom u kojoj se nalazi spisak svih reči koje se ponavljaju u tekstu.

Poslednji korak je da od tabele koju smo napravili kreiramo pivot tabelu. Polje „REČI“ treba prevući u redove (Rows) i vrednosti (Values). Ako sada sortiramo tabelu u opadajućem redosledu prema frekvenciji videćemo koja reč se najčešće ponavlja u tekstu.

ideju za ovaj tekst mi je dala supruga mog kolege Ljubica Kiš kojoj se, ovom prilikom, zahvaljujem a vas pozivam da mi pišete i predlažete tekstove koji sadrže rešenje novih Excel problema.