Hamarosan az Egyesült Államokon kívül is megjelenhet a Google új fejlesztése, a Whisk, ami több képből találja ki, milyen eredményt akar látni a felhasználó.
A képgenerálásra használható mesterséges intelligenciákat nemcsak szöveggel, hanem képpel is utasítani lehet a tartalom létrehozására. Ebből a szempontból nem jelent újat a Google Labs legújabb fejlesztése, a Whisk, ami szintén a vizuális inputra támaszkodik – abból a szempontból viszont nagyonis újdonságról van szó, hogy a kép generálásához bemeneti parancsként több képet is meg lehet adni.
A cég a Whisket úgy jellemezte, mint „új típusú kreatív eszközt”. A felhasználók fotorealisztikus képet – egyelőre – nem hozhatnak létre, helyette az előre meghatározott stílusokból választhatnak, így a végeredmény lehet rajzolt, de lehet akár plüss hatású is.
A Whisknek van egy fejlettebb szerkesztői felülete is, ahol a kép tárgya és stílusa mellett a jelenete is megadható. Mindemellett szöveges parancsokat is megadhatnak a felhasználók, hogy tovább finomítsák a végeredményt.
Bár a Google szerint a rendszer tiltja, hogy ismert emberek fotójának felhasználásával készüljenek képek, az Engadget beszámolója szerint azonban egyelőre nem jelzett be a rendszer, amikor ilyesmivel próbálkozott a lap újságírója. Emellett azt is érdemes megjegyezni, hogy a rendszer nem minden esetben végez tökéletes munkát, az itt található kép szerint például hiába akart valaki egy emberből plüssfigurát létrehozni, ezt nem tette meg a Whisk.
A Google új fejlesztése egyelőre csak az Egyesült Államokban érhető el, később azonban további országokban is megjelenhet.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.