Elárasztanak bennünket a különféle zeneszámok. Vannak közöttük tiszavirág életűek, mások pedig slágerek lehetnek, és még hosszú évekig dudorászuk őket. A gépi tanulás az idegtudományokra támaszkodva már azt is meg tudja jósolni, melyik számra vár ez utóbbi sors.
Naponta több tízezer új dal kerül feltöltésre a streamingplatformokra, azonban közülük csak keveset játszanak le egy tucatnál többször. Nehéz a feladatuk tehát a streamingszolgáltatásoknak és a rádióállomásoknak, hiszen ki kell választaniuk, mely dalokat érdemes felvenni lejátszási listáikra. Azzal a herkulesi feladattal néznek szembe, hogy kiválasszák, mely dalok érdemelnek helyet a lejátszási listájukon.
Eddig megérzéseikre, illetve újabban már a mesterséges intelligencia képességire támaszkodhattak, azonban ezek a jóslatok messze nem voltak tökéletesek. Most viszont megváltozhat minden: amerikai kutatók ugyanis 97 százalékos pontosságról számoltak be a találati előrejelzésben – írja a ZME Science.
A kutatók nem csupán a gépi tanulásra támaszkodtak, hanem neurofiziológiai adatokat is bevontak, azaz mélyen beleásták magukat abba, hogyan reagál az emberi agy a zenére. Ami különösen érdekessé teszi a kutatásukat: ehhez nem is kellett közvetlenül mérniük egy személy tényleges idegi reakcióját.
A Claremont Graduate Egyetem szakemberei 24 nemrégiben kiadott dalt kaptak egy streamingszolgáltatástól, valamint három hónapnyi adatot a megjelenés után. Ez magában foglalta a lejátszások számát, a felhasználók lejátszási listáinak kiegészítését és egyéb hasznos információkat. A különböző műfajokat felölelő dalkészlet tartalmazott „slágereket" – egy dal akkor számított slágernek, ha az elmúlt hat hónapban legalább 700 ezerszer streamelték.
A kutatók 33 kísérleti alanyt toboroztak a Claremont kampuszáról, akiket nem invazív neurofiziológiai rögzítő eszközökkel szereltek fel. Ilyen eszköz például az okosórákon lévő szívérzékelő. Az így kapott adatokat aztán betáplálták az egyetemen kidolgozott Immersion Neuroscience platformba, amely arra használja fel ezeket az adatokat, például egy személy pulzusszámát, hogy neurális állapotokra következtessen. A zenehallgatás közben tapasztalt másodlagos agyi jelek a hangulathoz és az energiaszinthez kapcsolódó agyi hálózatok aktivitását tükrözték.
Amikor az agy érzelmi ingereknek, például zenének van kitéve, dopamin és oxitocin szabadul fel. Ezek hatást gyakorolnak az emberi szervezetre, ami végül fiziológiai reakciókban, például pulzusszám-változásban nyilvánul meg. Ez persze mindenképp egy korlátozottabb megközelítés, mint mondjuk egy személy agyának közvetlen leképezése, de a technika mindenképpen alkalmas egy személy zenére adott idegi válaszának meghatározására. A legnagyobb előnye, hogy ezek a jelek olyan egyszerű dolgokkal mérhetők, mint egy okosóra vagy fitnesz karszalag, míg az agyi aktivitást általában bonyolult laborberendezésekkel rögzítik.
A kutatók a neurofiziológiai adatok mellett felmérést készítettek a dalok szubjektív értékeléséről. A résztvevőket megkérdezték, mennyire tetszett nekik a dal, gondolják-e, hogy a jövőben újra lejátsszák, szívesen ajánlanák-e az ismerősüknek.
Az adatgyűjtést követően a kutatók különféle statisztikai technikákat alkalmaztak, hogy felmérjék a neurofiziológiai változók előrejelző képességét. Előrejelzéseik további finomítása érdekében gépi tanulási modellt készítettek, különböző algoritmusokat vizsgálva, amíg el nem érték a lehető legnagyobb pontosságot. Az eredmények figyelemre méltóak voltak. Egy lineáris statisztikai modell sikeresen azonosította a slágereket 69 százalékos pontossággal. Amikor azonban gépi tanulást is alkalmaztak az összegyűjtött adatokra, a pontosság elérte a 97 százalékot. A kutatásvezető meg is magyarázta ezt: a gépi tanulás megragadja az agy eredendő nemlinearitását, és így jobban méri, hogy az agy mennyire értékeli az olyan élményeket, mint az új zene hallgatása.
Önmagában a módszer nem teljesen ismeretlen: a „neuroforecasting” (idegi előrejelzés) az egyének egy kis csoportjának idegi aktivitását használja fel, hogy előre jelezze egy nagyobb populáció válaszait. Korábban használták már a tőzsdei ingadozások előrejelzésére, vagy hogy melyik videó fog terjedni, esetleg ki nyer a választásokon. Ezt a módszert egészítették ki az amerikai kutatók a prediktív gépi tanulási modellel.
Mindez azt jelenti, hogy ezekkel az algoritmusokkal 97 százalékos pontossággal megjósolható a következő sláger? Azért nem egészen – mondja a kutatásvezető. Mind a résztvevők, mind a dalminták száma mérete meglehetősen kicsi volt, ráadásul az emberek zenei ízlése nagyon eltérő lehet, és gyakran nagy hatással van rájuk a kultúra. Mindazonáltal a megtapasztalt egyértelmű összefüggés utalhat arra, hogy ez a megközelítés nagyon jól megjósolhatja a slágereket. Ez pedig minden bizonnyal felkelti a streamingszolgáltatások és az alkotók figyelmét.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.