Arra már láttunk meglepően jó végeredményt, hogy egy leírt szöveg alapján képet hozott létre a mesterséges intelligencia. A fejlődés egy újabb lépcsőfokaként már videót is képes létrehozni szöveges instrukciók alapján.
A Meta (volt Facebook) hivatalosan novemberben indítja el a Make-A-Video nevű, mesterséges intelligencia alapú technológiát, azonban a „próbadarabok” már most megtekinthetők. A projekt lényege, hogy egy szöveges leírásból (pl: egy kutya, amelyik szuperhősruhát visel vörös köpennyel, átrepül az égen) videó készüljön.
Nem ez az első ilyesfajta próbálkozás a Meta részéről, az év elején már bemutatták az elődöt, az ugyancsak mesterséges intelligencia alapú Make-A-Scene-t, amellyel – írja a Meta – fotorealisztikus illusztrációkat és mesekönyv-minőségű rajzokat lehet készíteni szavakból, szöveges leírásokból és szabad formájú vázlatokból.
Az alábbi klip a "portrét festő mackó" leírásból készült:
De itt egy másik példa: így képzeli el a mesterséges intelligencia a "lajhárbébit, aki narancssárga kötött sapkában laptopozik, miközben a kijelző tükröződik a szemében".
A jelenlegi „videós” végeredmény persze még messze nem tökéletes, mégis figyelemre méltó teljesítményről van szó, ugyanis – jegyzi meg a ZME Science – a videókészítés sokkal nagyobb kihívást jelent. Az AI-motor szempontjából egy videó akár több ezer képből álló sorozat is lehet, azaz sokkal több adatra van szükség a gépi intelligencia betanításához. Ráadásul jóval kevesebb nagyméretű videókészlet áll rendelkezésre, mint amennyi kép, ami az idézett forrás szerint azt is jelenti, hogy a közeljövőben az ilyen projekteket elsősorban a nagyobb erőforrással rendelkező vállalatok tudják majd megcsinálni.
Mindenesetre a Meta mesterséges intelligenciája már elég jónak tűnik, több stílusban is készített már videókat. Ettől függetlenül egyelőre csak a kezdeti szakaszban tartunk, a videók egydimenziósak, az alanyok csak egyféle dolgot csinálnak. Viszont tekintettel arra, hogy milyen gyorsan fejlődik ez a terület, már a valósághű videók készítése sem lehet túl messze.
Ez viszont felveti a hamisítás kérdését, sőt maga a Meta is elismerte a fotorealisztikus videók készítésének veszélyeit. Azt mondják, hogy vízjel hozzáadásával lehet ezt kiküszöbölni, amiből a néző rögtön tudja, hogy nem valódi videóról van szó. Kérdés azonban, mennyire jelenthet ez megoldást. Hiszen ha egy mesterséges intelligencia szövegből tud videót készíteni, akkor egy vízjel eltüntetése sem lehet probléma számára.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.