Izvor: Piplmetar.rs, 20.Jun.2024, 01:31

DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Laboratorija za veštačku inteligenciju DeepMind iz Google-a radi na novoj tehnologiji koja može generisati zvučne podloge, pa čak i dijalog na osnovu video zapisa.
Laboratorija je podelila svoj napredak na projektu tehnologije video-to-audio (V2A), koja se može upariti sa Google Veo i drugim alatima za kreiranje video zapisa kao što je OpenAI Sora.
U svom blog postu, tim iz DeepMind-a objašnjava da sistem može razumeti sirove piksele i kombinovati te informacije sa tekstualnim upitima kako bi kreirao zvučne efekte za ono što se dešava na ekranu.
DeepMind generiše zvučne efekte i dijaloge Vredno je napomenuti da se alat može koristiti i za pravljenje zvučnih podloga za tradicionalne snimke, kao što su nemi...

Nastavak na Piplmetar.rs...






Napomena: Ova vest je automatizovano (softverski) preuzeta sa sajta Piplmetar.rs. Nije preneta ručno, niti proverena od strane uredništva portala "Vesti.rs", već je preneta automatski, računajući na savesnost i dobru nameru sajta Piplmetar.rs. Ukoliko vest (članak) sadrži netačne navode, vređa nekog, ili krši nečija autorska prava - molimo Vas da nas o tome ODMAH obavestite obavestite kako bismo uklonili sporni sadržaj.