Két-három sornyi begépelt szövegből akár egyperces, gyakorlatilag teljesen valósnak ható videót is létrehoz az OpenAI új eszköze, a Sora.
Az új videógeneráló modell képes többkarakteres, összetett jelenetek készítésére, meghatározott típusú mozgásokkal. Az OpenAI ígéri, a Sora „érti”, miként léteznek a valóság objektumai, és azokat úgy jeleníti meg, hogy a téma és a háttér is részletes, élethű. Persze megvannak még a maga apró hibái, melyek elárulják, hogy nem egy valós felvételről van szó – az összetettebb jeleneteknél egyes mozgások fizikája azért finoman fogalmazva is bizarr.
A végeredmény viszont egyértelműen jó, főleg ahhoz képest, hogy ez egy mesterséges intelligencia műve, kifejezetten hiteles.
Az alábbi példán a Sora Tokiót mutatja be felülnézetből, egy párt követve. Elkészítéséhez mindössze az alábbi parancsot adták meg:
„Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Az OpenAI több példavideót is készített, melyek alább megtekinthetők, és érdemes is megnézni őket.
A vállalat közölte: a Sora csak azután válik majd nyilvánosan használhatóvá, hogy egyrészt begyűjtötték róla művészek, filmesek visszajelzéseit, másrészt felmérték az eszközben rejlő kockázatokat és beépítették a megfelelő biztonsági intézkedéseket.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.