Az ajkak mozgásának követése egy újabb olyan lehetőség, amellyel növelhető, hogy egy mesterséges intelligencia megértse az emberi szavakat, és azokat kontextusba helyezze. Ezért is indult egy érdekes kísérlet Mark Zuckerberg cégbirodalmánál.
A Facebook anyavállalata rengeteg érdekes kísérletet folytat, többek között a mesterséges intelligencia (MI) területén is végez felméréseket, és olykor le is fejlesztenek egy ilyen programot. A vállalat már a szájról olvasással kísérletezik, mert azzal szerintük még okosabbá tehető a gép.
A cég ehhez egy új keretrendszert fejlesztett, amely reményei szerint hatékonyabbá teheti az MI által begyűjtött információk kezelését. A platform AV-HuBERT néven fut, és elsősorban abban segít, hogy az adatokat ne csak „hallja” a szoftver, hanem megértse és kontextusba tudja helyezni. A projektet a beszédfelismerő programok egyik negatívuma alapozta meg. Azokkal ugyanis csak a hallott szöveg alapján lehet dolgozni.
Ezzel szemben az ajkak figyelése sokkal könnyebbé teheti a kimondott szavak értelmezését, így pedig a gép még pontosabban reagálhat. A Metánál úgy vélik: egy ilyen rendszernek a mindennapi életben lesz majd haszna, például a zajos környezetben. Tegyük fel, hogy egy építkezés közelében, emberek között, az utcán akarjuk rávenni az eszközünket, hogy az teljesítsen valamit. A keretrendszer abban segíthet, hogy ezek a szituációk is könnyedén megvalósuljanak.
A platformmal kapcsolatos munka már rég nem elméleti szakaszban tart, az első eredmények pedig igen beszédesek: A Meta azt állítja, hogy a fejlesztés 75 százalékos pontossággal dolgozik, amikor egy szájról leolvasott mondatot szöveggé kell alakítani. Ehhez ráadásul a begyűjtött adatok 10 százaléka is elég.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.