Izvor: Politika, 30.Sep.2012, 23:04 (ažurirano 02.Apr.2020.)
Srpski jezik nespreman za digitalnu budućnost
Simpatični japanski robot „asimo” ćaskao je nedavno s Beograđanima na engleskom. Ako želimo da mu jednog dana zatražimo kafu na srpskom potrebno je da mu obezbedimo „udžbenike” iz kojih će učiti naš jezik.
Da bi osigurao sebi opstanak u digitalnoj budućnosti, neophodno je da jezik ima digitalizovane resurse. Prema rezultatima najnovijeg istraživanja, srpski je nažalost u grupi onih koji su u umreženom društvu >> Pročitaj celu vest na sajtu Politika << informacija i znanja osuđeni da nestanu.
– Naš jezik nije pripremljen za digitalno doba. Kao što su pojedini jezici koji nisu imali pismo izumrli s poslednjim govornikom, mislimo da jezicima koji nemaju dobru podršku tehnologija preti digitalno izumiranje, odnosno potisnuće ih veliki svetski jezici – kaže profesor matematike Ivan Obradović, koji je sa grupom domaćih informatičara i lingvista uradio analizu za srpski jezik u okviru studije Tehnološkog saveza za višejezičnu Evropu (META-NET).
Jezičke tehnologije većina ljudi redovno koristi. Na primer, za proveru gramatičke ispravnosti („spel ček” za engleski ili RAS za srpski). Tu spadaju i interaktivne „sekretarice” na smartfonima i sistemi automatskog prevođenja poput popularnog „Guglovog” prevodioca.
Jezičke tehnologije, posebno mašinsko prevođenje, u najvećoj meri se oslanjaju na statističke metode koje zahtevaju neverovatno veliki broj pisanih i govornih fajlova, što je problem za jezike s malim brojem govornika. Često su neprecizne, što se vidi u nerazumljivim mašinski prevedenim uputstvima za tehničke proizvode, ali i drugde.
– Nedavno sam dobio pismo od žene koja se predstavlja kao „promašaj Selena”. Sistem je mehanički preveo englesku reč „gospođica” kao „promašaj” jer se isto piše i izgovara (miss). Digitalizovani jezički resursi poboljšavaju te prevode – objašnjava Obradović, direktor Informativnog centra Beogradskog univerziteta.
Digitalizacija jezičkih resursa je proizvodnja u digitalnom obliku onoga što smo navikli da srećemo u štampanom: rečnika, gramatika, tekstova, informacija. Vrlo su važni paralelni korpusi na više jezika, koji su osnova za mašinsko prevođenje.
U studiji koju su za META-NET uradili domaći istraživači, predvođeni profesorom Dušanom Vitasom sa Matematičkog fakulteta, srpski je dobio dve jedinice (za automatsko prevođenje i gramatičku proveru) i dve dvojke (za sintezu govora i raspoloživost jezičkih resursa).
Iste ocene su dobili bugarski, mađarski, rumunski, grčki i jezici zemalja bivše SFR Jugoslavije. Najbolje je ocenjen engleski (četvorkom), a trojku su dobili nemački, francuski, holandski, italijanski i španski.
Holandski je, kaže Obradović, dobar primer da i mali jezici mogu da dobiju visoko mesto na lestvici. Iako nema veliki broj govornika, tamošnja stručna javnost je prepoznala značaj digitalizacije.
Ono što engleski, francuski i nemački imaju, a srpski (trenutno) nema jeste upravo obimna jezička zbirka u elektronskom obliku.
Olivera Durbaba, profesor na katedri za germanistiku Filološkog fakulteta, kaže da Nemci ovaj posao rade veoma temeljno i razvijaju korpusne baze decenijama.
– Nemački i srpski, u tom smislu, ne mogu da se porede, jer su nemački resursi mnogo obimniji i ljudi su obučeni da naprave sponu između tehnologije i lingvističke obrade. Kod nas baze postoje, ali su male i nepovezane.
Ovaj posao traži širu saradnju lingvista i informatičara i svih koji se bave jezikom i prepoznaju značaj informacionih tehnologija za jezik, naglašava profesor Obradović.
Ako srpski u nekom budućem istraživanju zaradi peticu, da li to znači da će zavisnost od engleskog biti manja?
– U Beogradu već imamo nekoliko pametnik kuća. Ideja je da sutra u upravljanju govornim jezikom možemo da se obraćamo pametnim uređajima na srpskom. Takođe, ukoliko bismo imali visok nivo podrške za mašinsko prevođenje, mogli bismo da koristimo svoj jezik, a da ga mašina prevodi. Ne može se očekivati da će računari savršeno raditi književne prevode, ali u poslovnoj komunikaciji bi to bilo sasvim moguće – zaključuje Obradović.
----------------------------------------------
Internet ne donosi propast
U javnosti se često vodi polemika o tome da li će način komunikacije na internetu naneti štetu jeziku. Dr Olivera Durbaba, koja je proučavala jezik na „Fejsbuku” i forumima, veruje da internet neće dovesti do propasti srpskog.
– Taj jezik, bez obzira što je pisan, nosi sve osobenosti govornog jezika. On se sada samo izmešta u drugi medij, što nama istraživačima olakšava posao, jer postoji u pisanoj formi. Naravno da to nije književni standard, ali od razgovornog stila i ne očekujemo da ima književni stil. Problem nastaje onda kada u pisani govor neosnovano ubacujemo elemente razgovornog stila: u sastavima, seminarskim radovima ili u štampi.
J. Kavaja
objavljeno: 01.10.2012.
Ima ili srpski jezik budućnost?
Izvor: medio.rs, 01.Okt.2012, 18:58
Simpatični japanski robot „asimo ćaskao je nedavno s Beograđanima na engleskom. Ako želimo da mu jednog dana zatražimo kafu na srpskom potrebno je da mu obezbedimo „udžbenike iz kojih će učiti naš jezik.






















