Tech HVG 2024. november. 23. 08:03

Néma mérget oltanak a zenékbe, és elég hatásos: egyszerűen kikészül tőle a mesterséges intelligencia

Az emberi fül számára hallhatatlanul mérgezi a zenét a HarmonyCloak nevű új szoftver, annak érdekében, hogy elejét vegye a mesterséges intelligencia esetleg szerzői jogot sértő ténykedéseinek.

Ahhoz, hogy a generatív mesterséges intelligencia jól működjön, tanítani kell, méghozzá óriási mennyiségű adattal. Minél több tartalom kerül bele ezekbe a modellekbe, annál részletesebb és változatosabb lehet a végeredmény.

A gond abból adódhat, hogy az adatok egy részét szerzői jog védi, azaz valójában nem lehetne oktatásra használni ezeket, legfeljebb a jogtulajdonosok engedélyével. Csak egy példa: fillérekért vásárolnak zeneszámokat (akárcsak egy egyszerű felhasználó), azonban egy ilyen vásárlás csak személyes engedélyt ad nekik, viszont nem jogosultak kereskedelmi forgalomba hozni a dalt, holott az MI oktatásakor valami ilyesmi történik. A nagy tartalomtulajdonosoknak megvannak az erőforrásai ahhoz, hogy mesterségesintelligencia-cégeket pereljenek, vagy jövedelmező licencszerződéseket kössenek, azonban a kis alkotók gyakran tehetetlenek.

A zenénél maradva, éppen ezeknek a kisebb szerzőknek segíthet a Tennessee, Knoxville és Lehigh Egyetem kutatóinak új eszköze, a HarmonyCloak program, amelyik beágyaz egy új zajréteget a zenébe, amelyet az emberi fül nem képes észlelni (a zenehallgatás élményét tehát nem zavarja), viszont a zenei fájlokat lényegében megtanulhatatlanná teszi a generatív mesterséges intelligencia modellek számára.

Kísérletek a Tennessee Egyetemen
Tennessee Egyetem

Míg a zene teljesen ugyanúgy szól, ha az ember hallgatja, a beágyazott zaj összezavarja az MI-modelleket, megtanulhatatlanná téve a zenét, és így megóv annak másolásától. Például egy gyönyörűen megkomponált szimfónia érintetlen maradhat az emberi fül számára, de a „Cloaked” változat egy mesterséges intelligencia számára rendezetlen, megtanulhatatlan adathalmazként jelenik meg. Ennek eredményeként, amikor egy mesterséges intelligencia modell megpróbál zenét generálni az eredeti zeneszerző stílusában, a kimenet inkoherens lesz, ami megakadályozza, hogy a modell megragadja a védett kompozíció lényegét.

A kutatóknak a zene dinamikus természetével is meg kellett küzdeniük. A dalok gyakran több hangszeres csatornát kevernek össze emberi hangokkal, mindegyik csatorna a saját frekvenciaspektrumát fedi le, és a csatornák az előtérből a háttérbe halványulhatnak, és az idő előrehaladtával változtathatnak tempójukon. Szerencsére, ahogyan egy mesterséges intelligencia modell megtévesztésére, úgy az emberi fül becsapására is van mód. Végül csak a fül számára érzékelhetetlen zajokat adtak a zenéhez.

Módszerüket 31 önkéntessel, valamint három legkorszerűbb zenegeneráló MI-modellel tesztelték. A kísérleti alanyok egyaránt magasra értékelték az eredeti és megtanulhatatlanná tett dalok kellemességét. Viszont a mesterséges intelligencia modellek teljesítménye gyorsan romlott, összességében nagyon rossz eredményt értek el.

„Eredmények alátámasztják, hogy a nem megtanulható zene jelentős hatással van az MI által generált zene minőségére és észlelésére. A zeneszerző szemszögéből ez a tökéletes megoldás; Az AI-modelleket nem lehet kiképezni a munkájukra, de zenéjüket továbbra is elérhetővé tehetik a nyilvánosság számára” – összegezte a Tennessee Egyetem kutatója, Jian Liu.

Felvetődik persze a kérdés, hogy miért nem lehet egyszerűen eltávolítani ezeket a finom változásokat általános digitális manipulációkkal. A válasz a HarmonyCloak természetében rejlik: ez nem egy egyszerű additív zaj vagy egy könnyen kiszűrhető rejtett jel. A HarmonyCloak által hozzáadott észrevehetetlen zajt úgy alakították ki, hogy az emberi hallásküszöb alatt maradjon, és tökéletesen beleolvadjon a zenébe. Ezt a zajt maga a zene takarja el, így az emberi fül számára nem észlelhető, miközben megzavarja az MI azon képességét, hogy tanuljon az adatokból.

Úgy kell tekinteni rá, mint a zene új, láthatatlan rétegére, amelyet csak a mesterséges intelligencia modellek képesek észlelni, de az emberek nem. Ez a védőréteg dinamikusan jön létre, alkalmazkodva az egyes zeneművek sajátosságaihoz. És mivel a HarmonyCloak által működtetett méretek dalonként változnak, a generatív mesterséges intelligencia modellek nem tudják könnyen visszafordítani vagy megkerülni a védőzajt anélkül, hogy ismernék az egyes sávok konkrét paramétereit.

Ha kíváncsi egyes zenék eredeti és „Cloaked” változatára, ezen a weboldalon meghallgathatja.

HarmonyCloak protects music from AI

A demonstration of AI-generated music with the same prompt, trained on the same piece of music – but one with HarmonyCloak and one without

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Gazdaság Sztojcsev Iván 2024. december. 29. 07:00

És akkor januárban Novák Katalin a mozgás évének nyilvánította 2024-et, aztán történt egy s más

Egész véletlenül tökéletesen beletrafált egykori köztársasági elnökünk, amikor elrendelte, hogy 2024 legyen a mozgás éve: mozgott idén a pártrendszer (egész váratlan irányokba), a GDP-növekedési előrejelzés (magasból a nulla közelébe), a forintárfolyam (hajaj), a világpolitika, és maga Novák Katalin is, jó messzire. Megnéztük a gazdaság és a vállalkozás rovatunkból az év legolvasottabb cikkeinek listáját, és most megmutatjuk, mi érdekelte idén önöket a legjobban.