Googleov AI trenira prepoznavanje glasova u gomili / VIDEO

Izvor: B92, 14.Apr.2018, 21:19   (ažurirano 02.Apr.2020.)

Googleov AI "trenira" prepoznavanje glasova u gomili / VIDEO

Vizija kompanije Google na polju procesiranja se poboljšavala tokom godina, što potkrepljuje činjenica da njihova Photos aplikacija prepoznaje lica, objekte i još mnogo toga. Sada Google želi isto da uradi i sa glasom. Preciznije, sa audio-vizuelnim razdvajanjem govora.

Recimo da se nalazite u gomili ljudi i pozove vas poznata osoba. Iako možda ne znate gde se vaš prijatelj/-ica nalazi u toj gomili, njegov/njen glas ima određeni obrazac koji možete odmah da prepoznate, >> Pročitaj celu vest na sajtu B92 << bez obzira na bučne ljude oko vas. Mašina možda neće moći da to čini efikasno, bar u trenutno popularnim servisima.

Međutim, istraživači Googlea su razvili sistem dubokog učenja koji može da razdvoji glasove gledajući lica osoba kada one govore i potom se može fokusirati na te glasove. Tim je uspeo ovo da postigne obučavanjem "neural networka" da prvo razume i prepoznaje pojedinačne glasove ljudi kada su oni pričali sami.

Zatim je simulirao virtuelne strane i ubacio indiviudualne glasove u ovo, kako bi istrenirao AI da nauči da izoluje više glasova u odvojene segmente.

Prema navodima iz Googlea, tehnika podrazumeva kombinovanje audio i vizuelnih signala za video ulaz, kako bi se govor razdvojio. Kombinacija vizuelnog elementa, zajedno sa zvukom, za razliku od pukog razdvajanja zvuka, pomaže u odvajanju i pročišćavanju govora povezanog sa određenim vidljivim govornikom u videu.

Ovo može biti korisno tokom komunikacije preko video četa. Google trenutno istražuje mogućnosti testiranja ove funkcije u svojim proizvodima kao što su Hangouts i Duo, prenosi Benchmark.

Google takođe veruje da bi ova tehnologija mogla da pomogne kod automatskih zatvorenih sistema za snimanje, gde se više govornika međusobno preklapa. Može da se koristi i kao pred proces za prepoznavanje govora. Alatka, takođe, može i bude zloupotrebljena i da se koristi u javnom prisluškivanju.

Nastavak na B92...



Napomena: Ova vest je automatizovano (softverski) preuzeta sa sajta B92. Nije preneta ručno, niti proverena od strane uredništva portala "Vesti.rs", već je preneta automatski, računajući na savesnost i dobru nameru sajta B92. Ukoliko vest (članak) sadrži netačne navode, vređa nekog, ili krši nečija autorska prava - molimo Vas da nas o tome ODMAH obavestite obavestite kako bismo uklonili sporni sadržaj.