tech

Már egy videón is látni, mire képes egy kínai startup és egyetem által fejlesztett videógenerátor, a Vidu. Bár a viszonyítási alap az OpenAI Sora, látszólag még nem tart ott minden tekintetben.

Egyetlen kattintással tud legfeljebb 16 másodperces FullHD videókat generálni a Shengshu Technology nevű kínai startup, valamint a Tsinghua Egyetem közösen fejlesztett mesterséges intelligenciája, a Vidu.

A képességeit tekintve az OpenAI Sorára hajazó modell a fejlesztői elmondása szerint egy saját fejlesztésű arhitektúrára épül, melyet Universal Vision Transformernek (U-ViT) neveztek el.

Ez – írja a The Global Times – két szöveg-videó modellt egyesít, a Diffusiont és a Transformert. A végeredmény, hasonlóan a Sorához, valósághű videók, dinamikusnak ható kameramozgás, részletes arckifejezések, árnyékok és fények – a kiadott videó alapján azonban kicsit olyan, mintha a mozgások a gyakorlatban kevésbé lennének olyan dinamikusak, mint az OpenAI modelljénél:

Meet Vidu, A New Chinese Text to Video AI Model
China’s Shengshu Technology and Tsinghua University have unveiled Vidu AI, a text-to-video model capable of generating 16-second clips at 1080p resolution with a single click. Article with more details – https://www.maginative.com/article/china-unveils-vidu-a-powerful-text-to-video-generator/ Shengshu Technology website (chinese) – https://www.shengshu-ai.com/home?ref=maginative.com

Egy dologban azonban biztosan le van maradva a Sorához képest: míg az OpenAI modellje akár egyperces videókat is képes generálni, a kínai Vidunál 16 másodperc a limit.

Nemrég a Microsoft is bemutatott egy videógeneráló MI-t, igaz, a VASA-1 némileg más: egy fotó alapján, szöveges parancsok mentén kelti életre a képet. Például a Mona Lisát.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

mesterséges intelligencia

Térdröntgenből meg lehet mondani, hogy ivott-e valaki sört

Olyan világot hozhat el a mesterséges intelligencia, ahol egyre kevésbé tud szabadon dönteni

A társaság, amelyiknek még Trump se tud ártani: mi vár 2024 sikercégére, az Nvidiára az új évben?

Hirdetés

Címkék

Egyetlen kattintással csinál a semmiből 16 másodpercnyi videót – ezt tudja a kínai újdonság

Meet Vidu, A New Chinese Text to Video AI Model

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

Térdröntgenből meg lehet mondani, hogy ivott-e valaki sört

Olyan világot hozhat el a mesterséges intelligencia, ahol egyre kevésbé tud szabadon dönteni

A társaság, amelyiknek még Trump se tud ártani: mi vár 2024 sikercégére, az Nvidiára az új évben?

Tétovázva futott neki az új esztendőnek a forint

Hihetetlen, de idén már oldtimerek lehetnek az első Fiat Bravák

Higgyünk MI-Sachának? Nem tesz jót a Netflix kreatív filmjének a mesterséges intelligencia

Magyar Péter elszámoltatási programja: nem csak börtönválogatottal fenyeget, stadionnyi embert vonna kérdőre

Jön a nagy földindulás: így szórják tele az országot e-autó töltőállomásokkal

A járványhelyzet miatt kötelező a maszkhasználat és látogatási korlátozásokat vezetnek be a Semmelweis Egyetem Klinikai Központjában

Haraszti Miklós: Minden kleptokrácia az arany vécékefén bukott el

Hiába fellebbezett Till Tamás gyilkosa, marad a börtönben

A lebukás idején Mészáros Lőrinc lánya is érdekelt volt exférje "brutális" kartellezésért megbírságolt cégében

Közel százévesen is könnyedén spárgázott – fotógaléria Keleti Ágnesről

Születésnapján helyezik örök nyugalomra Keleti Ágnest

Meghalt Keleti Ágnes, a világ legidősebb olimpiai bajnoka