Tech hvg.hu 2023. február. 02. 19:23

Hallgassa meg, mire képes a mesterséges intelligencia: bárki hangján megszólal, félelmetesen élethűen

Az amerikai ElevenLabs nemrég széles körben is elérhetővé tette a mesterséges intelligenciára támaszkodó hanggenerátorát, ami akár ismert emberek hangján is képes felolvasni egy szöveget. A rendszerre azonnal rátaláltak azok is, akik rossz célra használják.

Nemcsak a deepfake-videók miatt lehet aggódni, hanem a meghamisított hangok miatt is. Az amerikai ElevenLabs néhány napja indította el mesterséges intelligenciával megtámogatott szolgáltatását, amely felolvassa a leírt szöveget. A rendszer képes új hangot létrehozni, de arra is, hogy egy létező ember hangján szólaljon meg. És ez utóbbi az, ami komoly problémát okozhat.

A cég a Twitteren azt írta, növekszik a „hangklónozással” kapcsolatos visszaélések száma, ezért a jövőben további fékeket akar beépíteni a rendszerbe, hogy elejét vegye ezeknek. Bár a vállalat nem részletezte, hogy a visszaélés pontosan mit jelent, a Motherboard beszámolója szerint az „internet pöcegödreként” emlegetett 4chanen fórumrendszerben már olyan bejegyzések jelentek meg, amelyekben azt hallani, mintha egy ismert ember mondana el valami súlyos dolgot.

Az egyik ilyen esetben például Emma Watson hangjával olvastatják fel Hitler Mein Kampfjának egy részletét. A felhasználók olyan hangfelvételeket is közzétettek, amelyekben homofób, transzfób, erőszakos és rasszista megnyilvánulások hallhatóak. Nem tudni, hogy ezek közül mennyi készült az ElevenLabs fejlesztésével, de számos olyan bejegyzést találni, amiben linkelték a platformot.

Hogy a hamisítást hogyan kell elképzelni, azt korábban éppen az ElevenLabs mutatta meg egy videóban. Leonardo DiCaprio ENSZ-ben elmondott beszédét alakították át úgy, hogy bár a színészt látjuk beszélni, a szavait különböző ismert személyek (például Steve Jobs vagy Bill Gates) szinkronizálásával hallhatjuk. Bár a hangokon hallani, hogy kissé gépiesek, aki kevésbé figyel erre oda, azt meggyőzheti, hogy az adott szavakat az mondja, akinek a hangján hallani azokat.

A hamisított felvételek megjelenése nem meglepő, néhány évvel ezelőtt ugyanis deepfake pornóvideókat is készítettek a videókat módosító algoritmusok segítségével. Volt egyébként olyan, ami azt akarta elhitetni, hogy a főszereplője Emma Watson.

A Microsoft új mesterséges intelligenciája 3 mp-ig hallgatózik, aztán megszólal a beszélő hangján

A VALL-E nevű mesterséges intelligenciában legalább akkora potenciál van, mint amekkora veszély, hogy visszaélnek vele.

Az ElevenLabs most a visszajelzéseket gyűjti, valamint azt fontolgatja, hogy csak akkor engedi a hangklónozós funkció használatát, ha a felhasználónak engedélye van a hang felhasználásához.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.