tech

Fugatto néven mutatta be az Nvidia azt a mesterséges intelligenciát, amit a cég szerint számos területen lehet majd hasznosítani.

Újfajta generatív mesterségesintelligencia-modellt mutatott be nemrég az Nvidia, amit nemes egyszerűséggel csak a hangok svájci bicskájaként emleget. A Fugatto (Foundational Generative Audio Transformer Opus 1) nevű fejlesztésre akasztott jelző az Nvidia videója alapján valóban megérdemelt, a modell ugyanis szöveges parancsokból képes zenét, beszédet vagy hangeffektet generálni. Emellett arra is képes, hogy már meglévő zenét vagy hangot módosítson.

A cég közlése szerint a Fugattot egy nemzetközi csapat fejlesztette, így a beszédet többféle akcentussal is le tudja generálni, és többféle nyelven is ért az eszköz. „Olyan modellt akartunk létrehozni, amely úgy érti és generálja a hangot, mint az emberek” – mondta Rafael Valle, a projekt egyik kutatója.

A vállalat szerint a zenei producerek a technológia segítségével könnyen és gyorsan állíthatnak elő alapot egy dalötlethez, amit aztán tovább tudnak szerkeszteni, hogy kipróbálhassák, miként szólnak a különböző stílusok, hangok és hangszerek a dalban.

De az eszköz azoknak is hasznos lehet, akik nyelvet tanulnának, a Fugattóval ugyanis a nyelvtanulási eszközökhöz tudnak új anyagokat előállítani, míg a videójátékok fejlesztői előre rögzített hangokat tehetnek a játékokba, amelyek aztán azok alapján tűnnek fel, hogy az adott játékos milyen döntést hozott egy helyzetben.

Audio AI Fugatto Generates Sound from Text | NVIDIA Research
While some AI models can compose a song or modify a voice, none have the dexterity of the new offering, from #NVIDIAResearch. Fugatto (short for Foundational Generative Audio Transformer Opus 1), generates or transforms any mix of music, voices and sounds described with prompts using any combination of text and audio files.

Az NVIDIA nem közölte, hogy a nyilvánosság számára mikor válik elérhetővé a Fugatto, vagy, hogy egyáltalán elérhető lesz-e. Ugyanakkor a modell nem az első olyan generatív mesterséges intelligencia, amely szöveges üzenetekből hangokat tud létrehozni. A Meta korábban kiadott egy nyílt forráskódú eszközt, amely szöveges leírásokból képes hangokat létrehozni. A Google-nak van saját MusicLM nevű szöveg-zene MI-ja, amit az AI Test Kitchenön keresztül lehet elérni.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

mesterséges intelligencia

Legyőzte az embert a mesterséges intelligencia a szimulált légiharcban

A Google beépítette egy robotba az MI-jét, és ez új korszakot nyithat a robotikában

Ráeresztették a magyar kompetenciamérésre az MI-ket, meglepő eredmény született

Hirdetés

Címkék

Elkészült a „hangok svájci bicskája”, bármilyen szövegből hangot készít az Nvidia

Audio AI Fugatto Generates Sound from Text | NVIDIA Research

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

Legyőzte az embert a mesterséges intelligencia a szimulált légiharcban

A Google beépítette egy robotba az MI-jét, és ez új korszakot nyithat a robotikában

Ráeresztették a magyar kompetenciamérésre az MI-ket, meglepő eredmény született

A függetlenségpárti ellenzék nyerte a grönlandi választásokat

CNN-felmérés: nem tetszenek az amerikaiaknak Trump gazdasági intézkedései, de még mindig jobban támogatják, mint amit Musk csinál

A kormány akkor tiltja be, amikor már magától is megdögleni látszik a műhús

Putyin: Vannak kérdések a tűzszünettel kapcsolatban, az orosz csapatok meg épp támadnak

Trump a NATO-főtitkár jelenlétében adta elő elképzeléseit Grönland megszállásáról

Levelet kapott az orosz nagykövetségtől a XII. kerületi polgármester, mert emlékművet állítana a háború áldozatainak

Ülősztrájkolók foglalták el a manhattani Trump Tower előcsarnokát – fotók

Ezúttal panaszosként távozott dolgavégezetlenül az Alkotmánybíróságról a szocialisták ügyvédje

Magyar Péter visszatámad a zsírleszívás-vádra: „Hozzák nyilvánosságra, hogy Orbán Viktor 2010 óta milyen egészségügyi beavatkozásokon esett át”

Itt az új Mercedes CLA: beültünk a közel 800 km hatótávú csillagos villanyosba

„Teljes abszurdum” a drogügyi Alaptörvény-módosítás: szigorításnak nem lehet nevezni, de megoszt és provokál

Így csak a gazdagok járnak jól – árrésstopról Németh Dáviddal és Kovács Gáborral a Fülkében