Egyre több oldaláról mutatkozik be a mesterséges intelligencia. Rövid utasításokból képeket, videókat készít, sőt arra is képes, hogy zenét szólaltasson meg a szóbeli parancsok alapján. Íme a Meta fejlesztése, a MusicGen.
Természetesen a Meta sem akar kimaradni a nagy techcégek mesterséges intelligenciával kapcsolatos erőfeszítéseiből, és a MusicGen egy valóban figyelemre méltó fejlesztés. Egy olyan MI-ről van szó, amelyik felszólítások (vagy egy bemeneti dallam) alapján generál zenét. És ez bizony nem akármilyen teljesítmény. A kísérő kutatási dokumentum szerint a zenével kapcsolatos egyik fő kihívás az, hogy a teljes frekvenciaspektrum futtatását igényli, ami igen intenzív mintavételezést igényel, nem is beszélve a zenében fellelhető bonyolult struktúrákról és egymást átfedő hangszerelésekről.
A ChatGPT zenei párjának nevezhető MusicGen lehetővé teszi, hogy a felhasználó rövid szöveges leírást adjon a kívánt zenetípusról, majd az MI létrehoz egy 12 másodperces sávot, amely megfelel az utasításoknak.
A nyílt forráskódú MusicGennek egyelőre „csak” hangszeres képességei vannak, kizárólag az instrumentális zenékre összpontosít, azaz énekhangot még nem tud generálni. Ettől függetlenül az eszköz megfelelő háttérhangot hozhat létre videókhoz, prezentációkhoz, és egy jövőbeli frissítése már tartalmazhatja a lehetőséget az ének létrehozására is.
Van viszont itt egy sarkalatos kérdés (ami már sokszor előkerült a mesterséges intelligenciával kapcsolatban), a szerzői jog. A Meta törvényesség iránti elkötelezettségét mutatja, hogy az MI képzéséhez 10 ezer kiváló minőségű, licencelt zeneszámot használ, valamint jogdíjmentes dalokat olyan platformokról, mint a Shutterstock vagy a Pond5. A Meta kutatói azt állítják, hogy az összes zene, amelyre a modelljüket képezték, „a jogtulajdonosokkal kötött jogi megállapodások hatálya alá tartozik”.
Kiderült, védi-e szerzői jog a képeket, amit a mesterséges intelligencia hozott létre
A szerzői jogokkal foglalkozó amerikai hivatal szerint amikor a mesterséges intelligencia megalkot egy képet, azt ugyan emberi utasítás alapján teszi, de a végeredmény nem a kreativitás terméke.
A generatív mesterséges intelligencia növekvő népszerűsége azonban már eddig is aggodalmat keltett a szerzői jogok megsértésével kapcsolatban, és a művészek és a kiadók jogi lépéseket kezdtek el tenni a fejlesztők és platformok ellen műveik jogosulatlan felhasználása miatt. A Meta hamarosan ezeknek a frusztrált szervezeteknek a célkeresztjében találhatja magát, hiszen a háttérben ott rejlik annak a veszélye, hogy az MI plagizálja más zenészek munkáját, akár licenccel, akár nem.
A múlt hónapban a Google kiadott egy hasonló zenei generátort MusicLM néven, de úgy tűnik, hogy a MusicGen valamivel jobb eredményeket produkál. Egy mintaoldalon a kutatók összehasonlítják a MusicGen teljesítményét a MusicLM-mel és két másik modellel, a Riffusion és a Musai modellel, hogy bizonyítsák ezt.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.