Bárki letöltheti és ingyenesen használhatja a Hiya amerikai vállalat Chrome-bővítményét, amely néhány másodperc után képes megmondani, ha egy videóban látható személy hangját a mesterséges intelligencia hozta létre.
Az amerikai Hiya nevű vállalat – amely többek között a kamu hívások kiszűrésére specializálódott, világszerte mintegy 400 millió felhasználóval – az amerikai elnökválasztásra készülve egy ingyenes bővítményt készített a Chrome böngészőhöz. A Hiya Deepdake Voice Detector lényege, hogy egy adott hangzó tartalmat elemez, majd megmondja róla, hogy az valós hang-e, vagy esetleg a mesterséges intelligenciával hozták létre.
A bővítmény használata ingyenes – letölteni a Chrome webáruházából, erről a linkről lehet –, de a használata regisztrációhoz kötött. Ez a szokásos folyamat szerint zajlik: a telepítés után, az első használat előtt a bővítmény arra kéri a felhasználót, adja meg az e-mail-címét, az odaérkező hivatkozásra kattintva pedig aktiválódik a fiók.
A bővítménnyel naponta 20 hangmintát lehet kielemeztetni. Az Engadget beszámolója szerint a szolgáltatás tesztelői 99 százalékos hatékonyságról számoltak be, a cég szerint pedig azokat a mesterséges intelligenciával generált hangokat is felismeri, amin egyébként nem tanították be a rendszert.
A bővítményt mi is kipróbáltuk, és – spoiler alert – igen megbízhatónak tűnik. Volt azonban olyan feladat, ami kifogott rajta.
Kezdésnek egy egyszerű feladat elé állítottuk a rendszert: felismeri-e a Google Fordítóba beírt, majd felolvastatott szöveget? A válasz mindkét esetben – magyarul és angolul is felolvastattuk ugyanazt a mondatot a rendszerrel – igen volt. A bővítmény egy 1-től 100-ig terjedő skálán pontozza a hallott anyagot, a mintáról pedig mindkétszer megállapította, hogy deepfake-technológiával készült, így 1-est adott rájuk.
A következő tesztben már emeltük a tétet. A YouTube-ról egy olyan videót játszottunk le a bővítménynek, ahol először az eredeti, utána pedig a deepfake-hangot lehetett hallani ugyanattól a személytől. A tesztet az alábbi videóval végeztük el.
A rendszer mindkettő esetében helyes ítéletet hozott. Míg az eredeti hangot 94 pontosra értékelte (vagyis lényegében valós hangnak), addig a deepfake-verzió 1 pontot kapott.
A legnehezebb teszt ezután jött. A bővítménynek Magyarósi Csaba egyik videójának azon jelenetét mutattuk meg, amelyben a szegedi cég, az Antavo által létrehozott mesterséges intelligencia beszélt.
Ebben az esetben a hangot 95 pontra értékelte, vagyis lényegében valódi hangként könyvelte el.
Ez utóbbi esetében valószínűleg nehezítette a rendszer dolgát, hogy nem közvetlenül hallotta a hangot, hanem egy mikrofon felvételén keresztül. Ez viszont már torzulhatott annyira, hogy valódinak gondolja azt.
Ezek alapján úgy tűnik, a bővítmény tökéletesen használható például a kamu YouTube-videók kiszűrésére, de egy közvetítőközegen keresztül lejátszott hang esetében már lehetnek nehézségei.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.