Az emberi fül számára hallhatatlanul mérgezi a zenét a HarmonyCloak nevű új szoftver, annak érdekében, hogy elejét vegye a mesterséges intelligencia esetleg szerzői jogot sértő ténykedéseinek.
Ahhoz, hogy a generatív mesterséges intelligencia jól működjön, tanítani kell, méghozzá óriási mennyiségű adattal. Minél több tartalom kerül bele ezekbe a modellekbe, annál részletesebb és változatosabb lehet a végeredmény.
A gond abból adódhat, hogy az adatok egy részét szerzői jog védi, azaz valójában nem lehetne oktatásra használni ezeket, legfeljebb a jogtulajdonosok engedélyével. Csak egy példa: fillérekért vásárolnak zeneszámokat (akárcsak egy egyszerű felhasználó), azonban egy ilyen vásárlás csak személyes engedélyt ad nekik, viszont nem jogosultak kereskedelmi forgalomba hozni a dalt, holott az MI oktatásakor valami ilyesmi történik. A nagy tartalomtulajdonosoknak megvannak az erőforrásai ahhoz, hogy mesterségesintelligencia-cégeket pereljenek, vagy jövedelmező licencszerződéseket kössenek, azonban a kis alkotók gyakran tehetetlenek.
A zenénél maradva, éppen ezeknek a kisebb szerzőknek segíthet a Tennessee, Knoxville és Lehigh Egyetem kutatóinak új eszköze, a HarmonyCloak program, amelyik beágyaz egy új zajréteget a zenébe, amelyet az emberi fül nem képes észlelni (a zenehallgatás élményét tehát nem zavarja), viszont a zenei fájlokat lényegében megtanulhatatlanná teszi a generatív mesterséges intelligencia modellek számára.
Míg a zene teljesen ugyanúgy szól, ha az ember hallgatja, a beágyazott zaj összezavarja az MI-modelleket, megtanulhatatlanná téve a zenét, és így megóv annak másolásától. Például egy gyönyörűen megkomponált szimfónia érintetlen maradhat az emberi fül számára, de a „Cloaked” változat egy mesterséges intelligencia számára rendezetlen, megtanulhatatlan adathalmazként jelenik meg. Ennek eredményeként, amikor egy mesterséges intelligencia modell megpróbál zenét generálni az eredeti zeneszerző stílusában, a kimenet inkoherens lesz, ami megakadályozza, hogy a modell megragadja a védett kompozíció lényegét.
A kutatóknak a zene dinamikus természetével is meg kellett küzdeniük. A dalok gyakran több hangszeres csatornát kevernek össze emberi hangokkal, mindegyik csatorna a saját frekvenciaspektrumát fedi le, és a csatornák az előtérből a háttérbe halványulhatnak, és az idő előrehaladtával változtathatnak tempójukon. Szerencsére, ahogyan egy mesterséges intelligencia modell megtévesztésére, úgy az emberi fül becsapására is van mód. Végül csak a fül számára érzékelhetetlen zajokat adtak a zenéhez.
Módszerüket 31 önkéntessel, valamint három legkorszerűbb zenegeneráló MI-modellel tesztelték. A kísérleti alanyok egyaránt magasra értékelték az eredeti és megtanulhatatlanná tett dalok kellemességét. Viszont a mesterséges intelligencia modellek teljesítménye gyorsan romlott, összességében nagyon rossz eredményt értek el.
„Eredmények alátámasztják, hogy a nem megtanulható zene jelentős hatással van az MI által generált zene minőségére és észlelésére. A zeneszerző szemszögéből ez a tökéletes megoldás; Az AI-modelleket nem lehet kiképezni a munkájukra, de zenéjüket továbbra is elérhetővé tehetik a nyilvánosság számára” – összegezte a Tennessee Egyetem kutatója, Jian Liu.
Felvetődik persze a kérdés, hogy miért nem lehet egyszerűen eltávolítani ezeket a finom változásokat általános digitális manipulációkkal. A válasz a HarmonyCloak természetében rejlik: ez nem egy egyszerű additív zaj vagy egy könnyen kiszűrhető rejtett jel. A HarmonyCloak által hozzáadott észrevehetetlen zajt úgy alakították ki, hogy az emberi hallásküszöb alatt maradjon, és tökéletesen beleolvadjon a zenébe. Ezt a zajt maga a zene takarja el, így az emberi fül számára nem észlelhető, miközben megzavarja az MI azon képességét, hogy tanuljon az adatokból.
Úgy kell tekinteni rá, mint a zene új, láthatatlan rétegére, amelyet csak a mesterséges intelligencia modellek képesek észlelni, de az emberek nem. Ez a védőréteg dinamikusan jön létre, alkalmazkodva az egyes zeneművek sajátosságaihoz. És mivel a HarmonyCloak által működtetett méretek dalonként változnak, a generatív mesterséges intelligencia modellek nem tudják könnyen visszafordítani vagy megkerülni a védőzajt anélkül, hogy ismernék az egyes sávok konkrét paramétereit.
Ha kíváncsi egyes zenék eredeti és „Cloaked” változatára, ezen a weboldalon meghallgathatja.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.