Postoji veliki broj alata za odstranjivanje šuma i izolaciju određene informacije iz audio signala. Do sada je žamor bio rak rana za kvalitetnu izolaciju govora jedne osobe, ali Google Audio-Visual Speech Separation je na putu da i ovaj problem reši! Nešto što je do sada bilo nemoguće uraditi, zbog sličnog frekvencijskog spektra različitih glasova u istom snimku, sada je moguće uz pomoć vizuelne informacije. Google-ov alat ne samo da analizira različite frekvencijske spektre istovremenih govornika, već i analzira otvaranje usta u video snimku, prepoznajući na taj način šta bi od zvuka u tom trenutku moglo da bude korisno, a šta ne. Separacija, naravno, nije savršena, ali je ovo veliki korak dalje. Na žalost, ovakav postupak odstranjivanja neželjenog zvuka nije (za sad) moguć u slučajevima kada postoji samo audio, a ne i video snimak. Ovo je i dalje koncept, pa alat za sad nije dostupan za komercijalnu upotrebu.
Više informacija: https://research.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html
Нема коментара:
Постави коментар