Srpski jezik nespreman za digitalnu budućnost

Izvor: Politika, 30.Sep.2012, 23:04   (ažurirano 02.Apr.2020.)

Srpski jezik nespreman za digitalnu budućnost

Simpatični japanski robot „asimo” ćaskao je nedavno s Beograđanima na engleskom. Ako želimo da mu jednog dana zatražimo kafu na srpskom potrebno je da mu obezbedimo „udžbenike” iz kojih će učiti naš jezik.

Da bi osigurao sebi opstanak u digitalnoj budućnosti, neophodno je da jezik ima digitalizovane resurse. Prema rezultatima najnovijeg istraživanja, srpski je nažalost u grupi onih koji su u umreženom društvu >> Pročitaj celu vest na sajtu Politika << informacija i znanja osuđeni da nestanu.

– Naš jezik nije pripremljen za digitalno doba. Kao što su pojedini jezici koji nisu imali pismo izumrli s poslednjim govornikom, mislimo da jezicima koji nemaju dobru podršku tehnologija preti digitalno izumiranje, odnosno potisnuće ih veliki svetski jezici – kaže profesor matematike Ivan Obradović, koji je sa grupom domaćih informatičara i lingvista uradio analizu za srpski jezik u okviru studije Tehnološkog saveza za višejezičnu Evropu (META-NET).

Jezičke tehnologije većina ljudi redovno koristi. Na primer, za proveru gramatičke ispravnosti („spel ček” za engleski ili RAS za srpski). Tu spadaju i interaktivne „sekretarice” na smartfonima i sistemi automatskog prevođenja poput popularnog „Guglovog” prevodioca.

Jezičke tehnologije, posebno mašinsko prevođenje, u najvećoj meri se oslanjaju na statističke metode koje zahtevaju neverovatno veliki broj pisanih i govornih fajlova, što je problem za jezike s malim brojem govornika. Često su neprecizne, što se vidi u nerazumljivim mašinski prevedenim uputstvima za tehničke proizvode, ali i drugde.

– Nedavno sam dobio pismo od žene koja se predstavlja kao „promašaj Selena”. Sistem je mehanički preveo englesku reč „gospođica” kao „promašaj” jer se isto piše i izgovara (miss). Digitalizovani jezički resursi poboljšavaju te prevode – objašnjava Obradović, direktor Informativnog centra Beogradskog univerziteta.

Digitalizacija jezičkih resursa je proizvodnja u digitalnom obliku onoga što smo navikli da srećemo u štampanom: rečnika, gramatika, tekstova, informacija. Vrlo su važni paralelni korpusi na više jezika, koji su osnova za mašinsko prevođenje.

U studiji koju su za META-NET uradili domaći istraživači, predvođeni profesorom Dušanom Vitasom sa Matematičkog fakulteta, srpski je dobio dve jedinice (za automatsko prevođenje i gramatičku proveru) i dve dvojke (za sintezu govora i raspoloživost jezičkih resursa).

Iste ocene su dobili bugarski, mađarski, rumunski, grčki i jezici zemalja bivše SFR Jugoslavije. Najbolje je ocenjen engleski (četvorkom), a trojku su dobili nemački, francuski, holandski, italijanski i španski.

Holandski je, kaže Obradović, dobar primer da i mali jezici mogu da dobiju visoko mesto na lestvici. Iako nema veliki broj govornika, tamošnja stručna javnost je prepoznala značaj digitalizacije.

Ono što engleski, francuski i nemački imaju, a srpski (trenutno) nema jeste upravo obimna jezička zbirka u elektronskom obliku.

Olivera Durbaba, profesor na katedri za germanistiku Filološkog fakulteta, kaže da Nemci ovaj posao rade veoma temeljno i razvijaju korpusne baze decenijama.

– Nemački i srpski, u tom smislu, ne mogu da se porede, jer su nemački resursi mnogo obimniji i ljudi su obučeni da naprave sponu između tehnologije i lingvističke obrade. Kod nas baze postoje, ali su male i nepovezane.

Ovaj posao traži širu saradnju lingvista i informatičara i svih koji se bave jezikom i prepoznaju značaj informacionih tehnologija za jezik, naglašava profesor Obradović.

Ako srpski u nekom budućem istraživanju zaradi peticu, da li to znači da će zavisnost od engleskog biti manja?

– U Beogradu već imamo nekoliko pametnik kuća. Ideja je da sutra u upravljanju govornim jezikom možemo da se obraćamo pametnim uređajima na srpskom. Takođe, ukoliko bismo imali visok nivo podrške za mašinsko prevođenje, mogli bismo da koristimo svoj jezik, a da ga mašina prevodi. Ne može se očekivati da će računari savršeno raditi književne prevode, ali u poslovnoj komunikaciji bi to bilo sasvim moguće – zaključuje Obradović.

----------------------------------------------

Internet ne donosi propast

U javnosti se često vodi polemika o tome da li će način komunikacije na internetu naneti štetu jeziku. Dr Olivera Durbaba, koja je proučavala jezik na „Fejsbuku” i forumima, veruje da internet neće dovesti do propasti srpskog.

– Taj jezik, bez obzira što je pisan, nosi sve osobenosti govornog jezika. On se sada samo izmešta u drugi medij, što nama istraživačima olakšava posao, jer postoji u pisanoj formi. Naravno da to nije književni standard, ali od razgovornog stila i ne očekujemo da ima književni stil. Problem nastaje onda kada u pisani govor neosnovano ubacujemo elemente razgovornog stila: u sastavima, seminarskim radovima ili u štampi.

J. Kavaja

objavljeno: 01.10.2012.

Nastavak na Politika...



Pročitaj ovu vest iz drugih izvora:
Povezane vesti

Ima ili srpski jezik budućnost?

Izvor: medio.rs, 01.Okt.2012, 18:58

Simpatični japanski robot „asimo ćaskao je nedavno s Beograđanima na engleskom. Ako želimo da mu jednog dana zatražimo kafu na srpskom potrebno je da mu obezbedimo „udžbenike iz kojih će učiti naš jezik.

Nastavak na medio.rs...

Napomena: Ova vest je automatizovano (softverski) preuzeta sa sajta Politika. Nije preneta ručno, niti proverena od strane uredništva portala "Vesti.rs", već je preneta automatski, računajući na savesnost i dobru nameru sajta Politika. Ukoliko vest (članak) sadrži netačne navode, vređa nekog, ili krši nečija autorska prava - molimo Vas da nas o tome ODMAH obavestite obavestite kako bismo uklonili sporni sadržaj.