Frekvencijski rečnik - monumentalni projekat

Izvor: Radio Televizija Vojvodine, 03.Jun.2010, 20:51   (ažurirano 02.Apr.2020.)

Frekvencijski rečnik - monumentalni projekat

BEOGRAD -

JP "Službeni glasnik" danas je u Rektoratu Beogradskog univerziteta predstavio monumentalni projekat prof. Đorđa Kostića (1909-1995) u koji je ugrađeno 11 miliona reči da bi se stvorio jedinstveni rečnik srpskog jezika o učestalosti korišćenja određenih reči kroz period od 12. veka do savremenog doba.

Pred naučnu javnost su izneta prva tri toma "Frekvencijskog rečnika - Kvantitativnog opisa strukture srpskog jezika" koji predstavljaju prvo kolo "Srpski >> Pročitaj celu vest na sajtu Radio Televizija Vojvodine << jezik od XII do XVIII veka" i bave se rečnikom Domentijanovih dela.

O celom projektu, koji je započet 1957. godine, a trajaće još niz godina, govorili su urednik Biblioteke LEXIS Milojko Knežević, priređivač Rečnika dr Aleksandar Kostić i stručni recenzent prof. dr Đorđe Trifunović.

Direktor "Glasnika" Slobodan Gavrilović izrazio je zadovoljstvo što je ova izdavačka kuća preuzela realizaciju tako važnog projekta za srpsku kulturu koji smatra da je najveći izdavački poduhvat u istoriji "Glasnika".

On je konstatovao da su samo veliki sanjari poput Kostića u stanju da se poduhvate posla koji je obuhvatio 11 miliona reči i tako uvrstio Srbiju među velike kulture koje imaju Frekvencijske rečnike svog jezika kroz istoriju. On je napomenuo da će Glasnik objaviti ceo rečnik u digitalnoj formi.

Gavrlović se požalio da javnost nije dovoljno upoznata da ovim projektom na kome sarađuju sa Institutom za eksperimentalnu fonetiku i patologiju govora i Laboratorijom za eksperimentalnu psihologiju Filozofskog fakulteta BU.

Gavrilović je poklonio prva tri toma Rečnika rektoru BU prof. dr Branku Kovačeviću.

Govoreći o pionirskom radu prof. dr Kostića koji je osnovao Institut za eksperimentalnu fonetiku i patologiju govora, urednik edicije LEXIS Knežević je istakao da je on u okviru projekta mašinskog prevođenja i automatskog prepoznavanja teksta formirao ručno anotirani dijahroni korpus srpskog jezika, obima 11 miliona reči, od 12. veka do savremenog jezika.

Početkom 1996. godine, ručno obrađena građa prebačena je u elektronski oblik.

Napravljen je Frekvencijski rečnik savremenog srpskog jezika (sedam tomova) izveden iz dva poduzorka savremenog srpskog jezika (poetski tekstovi i dnevna štampa).

Pored frekvencije odrednica date su i frekvencije svakog gramatičkog oblika odrednica koje su su javile u uzorku (u toku je proširenje Rečnika dodavanjem uzorka literarne proze).

Upravo objavljeni Frekvencijski rečnik Domentijana, omogućava pretraživanje odrednica i izvornih tekstova. U prvom tomu dati su izvorni i gramatički obrađeni tekstovi oba Domentijanova žitija sa odrednicama i gramatičkom specifikacijom svake reči. U drugom tomu su frekvencijski rečnici žitija sv. Simeona i sv. Save. Oba žitija sadrže 78.284 reči, 4.606 odrednica i 15.783 gramatička oblika odrednica. Od 3.139 gramatičkih oblika sistema gramatičkog kodiranja srpskoslovenskog jezika, kod Domentijana se javljaju 972.

U obrađenom korpusu srpskog jezika poseban značaj, kako je naveo njegov priređivač Aleksandar Kostić ima segment od 12. do 18. veka (500.000 reči) koji, preciznom anotacijom gramatičkih oblika i analizom učestalosti svake reči, istraživačima znatno olakšava proučavanje najranijih faza razvoja srpskog jezika.

Nastavak na Radio Televizija Vojvodine...



Napomena: Ova vest je automatizovano (softverski) preuzeta sa sajta Radio Televizija Vojvodine. Nije preneta ručno, niti proverena od strane uredništva portala "Vesti.rs", već je preneta automatski, računajući na savesnost i dobru nameru sajta Radio Televizija Vojvodine. Ukoliko vest (članak) sadrži netačne navode, vređa nekog, ili krši nečija autorska prava - molimo Vas da nas o tome ODMAH obavestite obavestite kako bismo uklonili sporni sadržaj.