tech

Elég egy szöveges leírást adni, és a mesterséges intelligencia, szolgálatkész festő módjára, képet készít belőle, meglepően jó eredménnyel.

Míg a legtöbb kép viszonylag könnyen leírható szavakkal, a képek szövegbevitelből történő előállítása speciális készségeket és többórás munkát igényel. Ha viszont a mesterséges intelligencia automatikusan fotorealisztikus képeket állítana elő természetes nyelven megfogalmazott szövegekből, az nem csak lehetővé tenné az emberek számára, hogy gazdag és változatos vizuális tartalmakat hozzanak létre soha nem látott könnyedséggel, hanem egyszerűbb iteratív finomítást is lehetővé tenné. Az ember elképzel egy tájat vagy valamilyen jelenetet, ezt szavakkal leírja, és a mesterséges intelligencia elkészíti a képet.

Már korábban is voltak ilyesfajta kísérletek, azonban ezek sikere vitatható volt, illetve túlságosan bonyolultak voltak. Viszont a 2015-ben (Elon Musk és más neves technológiai guruk által) alapított OpenAI mesterséges intelligencia kutatólaboratórium szakemberei által kifejlesztett technológia lenyűgöző eredményeket hozott nemrégiben.

Mindehhez úgynevezett irányított diffúziós modelleket használtak a kutatók. A GitHubon elérhetővé tett GLIDE (Guided Language-to-Image Diffusion for Generation and Editing) nevű, 3,5 milliárd paramétert tartalmazó modellben a mesterséges intelligencia a szöveges leírás alapján keres egy képet, majd azt szerkeszti és festi át az elvártaknak megfelelően.

ZME Science

Például ha azt kérik tőle, hogy készítsen egy képet, ahol egy lány egy corgit ölel, akkor keres egy képet, ahol egy lány egy – bármilyen – kutyát ölel, majd kicseréli az ebet egy corgira – mintha csak a Photoshopban lennénk. A tesztek során a GLIDE kiváló minőségű képeket készített valósághű árnyékokkal, tükröződésekkel és textúrákkal.

OpenAI

A modell egyébként képes saját illusztrációkat is készíteni különféle stílusokban, például Van Gogh stílusában vagy egy meghatározott festmény stílusában. A GLIDE olyan fogalmakat is képes értelmezni, mint csokornyakkendő vagy születésnapi kalap egy corgira, miközben attribútumokat, például színt vagy méretet is köt ezekhez az objektumokhoz. A felhasználók egy egyszerű szöveges paranccsal különféle szerkesztéseket is végezhetnek a meglévő képeken.

Természetesen a GLIDE sem tökéletes. A fent közölt példák sikertörténetek, de a tanulmányban voltak kudarcok is. Egyes felszólítások, amelyek rendkívül szokatlan tárgyakat vagy forgatókönyveket írnak le, mint például egy háromszög „kerekű” autó kérése, nem adnak kielégítő eredményeket. A diffúziós modellek csak annyira jók, mint azok az adatok, amelyekkel kiképezték őket, így a képzelet még mindig az emberiség sajátja – legalábbis egyelőre.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

mesterséges intelligencia

4iG Group

MI a vállalatoknál: láthatatlan segítő vagy biztonsági rés?

A ChatGPT szinte hibátlanul felismeri a leggyakoribb bőrproblémákat

Képernyő nélküli telefonon dolgozhat az Apple korábbi sztártervezője, az OpenAI venné meg a fejlesztőcéget

Hirdetés

Címkék

Nézze, milyen lenyűgöző képeket készít a mesterséges intelligencia, ha megadnak neki pár szót

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

MI a vállalatoknál: láthatatlan segítő vagy biztonsági rés?

A ChatGPT szinte hibátlanul felismeri a leggyakoribb bőrproblémákat

Képernyő nélküli telefonon dolgozhat az Apple korábbi sztártervezője, az OpenAI venné meg a fejlesztőcéget

A pirosnál a gyalogosok közt tolakodott egy autós, a másik egy kamiontól sem ijedt meg - videó

Itt az EU ajánlata Trumpnak: 0 százalékos vámok, kölcsönösen

Néhány kósza hídfoglalási kísérlet után visszatértek az Erzsébet hídra a tüntetők – élő közvetítés Hadházyék hajnalig tartó tüntetéséről

„Nem úgy fekszel le, mint Magyarországon, hogy gyomorgörcsben vagy akkor is, ha jól élsz” – így érzik magukat a Spanyolországba települt magyarok

A Kínával szembeni vámok szerdán legalább 104 százalékra emelkednek – közölte a Fehér Ház

Elon Musk arra kérte Trumpot, vonja vissza a vámháborús döntését

ZDF: Oroszországban már azelőtt rákerestek egy németországi késelésre, hogy az megtörtént volna

Trump ostoba, de ez a legkisebb probléma

Ne a csordát kövessék – így kerülhetik el a befektetők a mentális csapdákat

Az amerikai ügyvivő szerint nem lesz több aktivizmus, de az orosz energia miatt odaszúrt a magyar kormánynak

Az Arsenal alaposan megverte a BL-címvédő Real Madridot, az Inter egy káprázatos góllal győzte le a Bayern Münchent

Van valami szívszorító abban, ahogy Thomas Müllert kirakja a Bayern München