Tech hvg.hu 2022. december. 23. 17:03

Elkészült a mesterséges intelligencia, ami szövegből alkot zenét

A Riffusion nevű mesterséges intelligencia képes bármilyen karaktersort zenévé konvertálni.

Az elmúlt években készült már olyan algoritmus, ami képes egy szövegből képet alkotni, olyan azonban még nem, ami zenét fabrikál a bemeneti írásból. Mostantól azonban már ilyennel is játszhatunk.

A Riffusion nevű mesterséges intelligencia ugyanis pontosan ezt tudja – számolt be róla az Analytics Insight. A hangokat úgynevezett szonogramokban, vagyis 2D-s képekben tárolja, vagyis először egy képet hoz létre a rendszer, majd utána a hangot. A szonogram X-tengelye az időt (a frekvenciák lejátszásának sorrendjét balról jobbra), az Y-tengely pedig a hangok frekvenciáját ábrázolja. Az egyes pixelek színe az adott hang hangerősségét mutatja az adott pillanatban.

hvg.hu

Az oldalra gyakorlatilag bármit beírhatunk, a bemenetet a rendszer pedig zenévé konvertálja. Ha különböző stílusokat és hangzásokat adunk meg – például azt, hogy smooth tropical dance jazz –, akkor ezeket igyekszik ötvözni, így pedig akár ihletet is kaphat az, aki komponálni szeretne.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.