Rečnik koji niko nema

Izvor: Politika, 02.Jun.2010, 23:22   (ažurirano 02.Apr.2020.)

Rečnik koji niko nema

Ako se otkriju razlozi dosadašnjih promena u jeziku, biće moguće predvideti kako će u budućnosti izgledati srpski jezik

„Službeni glasnik”, zajedno sa Institutom za eksperimentalnu fonetiku i patologiju govora i Laboratorijom za eksperimentalnu psihologiju Filozofskog fakulteta u Beogradu, započeo je objavljivanje kapitalnog dela „Kvantitativni opis strukture srpskog jezika”, čiji je autor Đorđe Kostić (1909–1995), osnivač i dugogodišnji direktor Instituta >> Pročitaj celu vest na sajtu Politika << za eksperimentalnu fonetiku i patologiju govora u Beogradu. Ovaj projekat izveden je iz „Korpusa srpskog jezika” koji je inicirao i osmislio Đorđe Kostić, a na ovom projektu, koji je trajao od 1957. do 1962. godine, bilo je angažovano oko 400 saradnika. Korpus se sastoji od jedanaest miliona reči, od kojih je svaka ručno gramatički obrađena, obuhvata srpski jezik od XII veka do savremenog jezika. U prvom segmentu edicije „Kvantitativni opis strukture srpskog jezika” obuhvaćen je srpski jezik od XII do XVIII veka, a upravo je objavljeno prvo kolo koje sadrži frekvencijski rečnik Domentijanovog „Žitija svetoga Simeona” i „Žitija svetoga Save”, u tri toma. Rečnik je priredio prof. Aleksandar Kostić, a stručni savetnik je prof. Đorđe Trifunović.

Iza ovih stručnih i pomalo komplikovanih naziva krije se jedinstven frekvencijski rečnik, kakav ne postoji ni za jedan od svetskih jezika. U „Žitiju svetoga Simeona” i „Žitiju svetoga Save”, svakoj reči je određen gramatički oblik i učestalost pojavljivanja. Prvi tom (900 strana) sadrži izvorni i gramatički obrađen tekst oba žitija. U drugom (1061) i trećem tomu (1143), dati su frekvencijski rečnici svakog od žitija i zbirni rečnik oba žitija, odnosno Frekvencijski rečnik Domentijana.

Na osnovu ovakvog rečnika, objašnjava prof. Kostić, mogu se porediti srpski jezik XII veka i savremeni srpski jezik, od nivoa leksike do nivoa gramatike. Tako, na primer, u jeziku XII veka dativ je bio izuzetno frekventan padež, dok je u savremenom srpskom jeziku on najmanje frekventan (oko dva odsto). Ukoliko bi se određenim statističkim postupcima definisale promene i one izrazile kao funkcije, u principu bi bilo moguće napraviti gruba predviđanja u kom pravcu će se srpski jezik menjati i kako će, na primer, izgledati kroz 400 godina.

Korpus srpskog jezika podeljen je na pet vremenskih perioda: srpski jezik od XII do XVIII veka, jezik XVIII veka, Sabrana dela Vuka St. Karadžića, jezik druge polovine XIX veka i savremeni srpski jezik. Uzorak srpskog jezika od XII do XVIII veka sastoji se od oko 500.000 reči i obuhvata najznačajnija dela srpskog srednjovekovnog pisanog nasleđa. Uzorak je podeljen u dva dela: prvi obuhvata dela Svetoga Save, Stefana Prvovenčanog, Domentijana, Teodosija, arhiepiskopa Danila, Grigorija Camblaka i patrijarha Pajsija, dok drugi deo čine: „Stare srpske povelje i pisma”, u izdanju Ljubomira Stojanovića. Sva dela gramatički su obrađena u celini.

Pedesetih godina prošlog veka radom na uzorku srpskog jezika od XII do XVIII veka, kao i radom na uzorku jezika XVIII veka, podseća Aleksandar Kostić, rukovodio je prof. Đorđe Sp. Radojičić, u ono vreme jedan od naših najvećih stručnjaka za staru srpsku književnost. Početkom 1996. godine, u saradnji Instituta za eksperimentalnu fonetiku i patologiju govora i Laboratorije za eksperimentalnu psihologiju Filozofskog fakulteta u Beogradu, počinje digitalizacija korpusa. Unos materijala koji se odnosi na srpski jezik od XII do XVIII veka započet je 2000. godine. Tada je formirana i manja ekipa stručnjaka za srpskoslovenski jezik pod stručnim nadzorom prof. Đorđa Trifunovića. Pripisivanje odrednica i korekturu gramatičke obrade Domentijanovih žitija uradila je dr Zorica Vitić.

Oba žitija, ističe prof. Kostić, sadrže 78.284 reči, 4.606 odrednica i 15.783 gramatička oblika odrednica. „Žitije svetoga Simeona” sastoji se od 26.572 reči, 2.852 odrednice i 7.923 oblika, dok „Žitije svetoga Save” sadrži 51.712 reči, 3.905 odrednica i 12.440 oblika. Od 3.139 gramatičkih oblika, koje sadrži sistem gramatičkog kodiranja srpskoslovenskog jezika, kod Domentijana se javljaju 972 oblika. Iz odnosa broja reči i broja odrednica u oba žitija može se zaključiti da je leksičko bogatstvo Domentijana izuzetno i da se može porediti sa leksičkim bogatstvom najznamenitijih savremenih autora.

Početkom 2002. godine započeta je digitalizacija celokupne objavljene srpske pisane baštine od XII do XVIII veka. U elektronskom obliku trebalo bi da se nađe preko dva miliona reči srpskoslovenskog jezika. Time bi bila postavljena osnova za izradu prvog srpskoslovensko-srpskog rečnika, a rad na njemu bio bi u velikoj meri olakšan postojanjem elektronskog korpusa. Rad na elektronskom korpusu srpskog pisanog nasleđa od XII do XVIII veka naišao je na razumevanje Ministarstva kulture Republike Srbije i Pokrajinskog sekretarijata za obrazovanje i kulturu koji su finansijski pomogli ovaj projekat.

Frekvencijski rečnik Domentijana i budući rečnici koji se odnose na srpski jezik između XII i XVIII veka, naglašava Aleksandar Kostić, rezultat su predanog rada velikog broja stručnjaka. Publikovanjem frekvencijskih rečnika i izvornog materijala, njihov rad postaje dostupan širem krugu istraživača iz različitih naučnih oblasti. Ukoliko bi ovaj projekat dodatno podstakao istraživanja srpskoslovenskog jezika i srpske kulturne istorije, njegova svrha bila bi ispunjena, a napori koji su u njega uloženi bili bi time višestruko nagrađeni.

U pripremi su tri nova toma: „Žitije svetoga Save” od Teodosija i „Životi kraljeva i arhiepiskopa srpskih” – arhiepiskopa Danila II u dva toma, koji bi trebalo da se pojave do predstojećeg Sajma knjiga u Beogradu. Čitav projekat trebalo bi da bude okončan do 2013. godine.

---------------------------------------

Predstavljanje u Kapetan-Mišinom zdanju

U Rektoratu Univerziteta u Beogradu (Kapetan-Mišino zdanje), danas u 13 časova, prva tri toma kapitalnog dela: „Kvantitativni opis strukture srpskog jezika”, predstaviće prof. Đorđe Trifunović i prof. Aleksandar Kostić.

---------------------------------------

Reči kod Domentijana

U Domentijanovim žitijima najčešće reči su: Hristos, kir Sava, Sveta gora, Jerusalim, David, Izrailj, kir Stefan, Pavle, Egipat…, a od imenica najčešće su: Bog, Gospod, otac, sveti duh, zemlja, Hristos, otačestvo, blagodet, molitva, čedo, ljubav, sila, dan, sin, vek, duša, srce…

Zoran Radisavljević

[objavljeno: 03.06.2010.]

Nastavak na Politika...



Povezane vesti

Promocija "Frekvencijskog rečnika"

Izvor: B92, 03.Jun.2010, 14:45

Prvo, trotomno kolo Frekvencijskog rečnika srpskog jezika, autora Đorđa Kostića, biće predstavljeno večeras u Rektoratu Univerziteta u Beogradu...Deo svakog štampanog kola biće i elektronska izdanja pojedinačnih frekvencijskih rečnika i zbirnog frekvencijskog rečnika odgovarajućeg segmenta...

Nastavak na B92...

Napomena: Ova vest je automatizovano (softverski) preuzeta sa sajta Politika. Nije preneta ručno, niti proverena od strane uredništva portala "Vesti.rs", već je preneta automatski, računajući na savesnost i dobru nameru sajta Politika. Ukoliko vest (članak) sadrži netačne navode, vređa nekog, ili krši nečija autorska prava - molimo Vas da nas o tome ODMAH obavestite obavestite kako bismo uklonili sporni sadržaj.