A Riffusion nevű mesterséges intelligencia képes bármilyen karaktersort zenévé konvertálni.
Az elmúlt években készült már olyan algoritmus, ami képes egy szövegből képet alkotni, olyan azonban még nem, ami zenét fabrikál a bemeneti írásból. Mostantól azonban már ilyennel is játszhatunk.
A Riffusion nevű mesterséges intelligencia ugyanis pontosan ezt tudja – számolt be róla az Analytics Insight. A hangokat úgynevezett szonogramokban, vagyis 2D-s képekben tárolja, vagyis először egy képet hoz létre a rendszer, majd utána a hangot. A szonogram X-tengelye az időt (a frekvenciák lejátszásának sorrendjét balról jobbra), az Y-tengely pedig a hangok frekvenciáját ábrázolja. Az egyes pixelek színe az adott hang hangerősségét mutatja az adott pillanatban.
Az oldalra gyakorlatilag bármit beírhatunk, a bemenetet a rendszer pedig zenévé konvertálja. Ha különböző stílusokat és hangzásokat adunk meg – például azt, hogy smooth tropical dance jazz –, akkor ezeket igyekszik ötvözni, így pedig akár ihletet is kaphat az, aki komponálni szeretne.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.