Új utat választott az Adobe a képmanipuláláshoz használt mesterséges intelligencia oktatására: videókat is bevett a tréninghez. Az MI ezután alkalmassá válik az egészen összetett képszerkesztési feladatok automatizálására.
A képszerkesztés éllovasa, az Adobe folyamatosan fejleszti a felhasználói számára kínált eszközöket. Kutatási részlegének, az Adobe Researchnek legújabb műve a Magic Fixup, amely az egészen összetett szerkesztési feladatok automatizálására hivatott.
Mint a legkorszerűbb képszerkesztő eszközöknél, a Magic Fixup mögött is mesterséges intelligencia áll, amelynek a betanítását azonban az eddigiektől eltérően végezték. Az Adobe mérnökei ugyanis úgy vélték, hogy egy ilyen eszköz jobban teljesíthet, ha nem fényképekkel, hanem videotartalmakkal oktatják őket – a Magic Fixup több millió videokockapárból tanult. Ez az újszerű módszer – írják a kutatók – lehetővé teszi az MI-technológia számára, hogy jobban megértse, miként változnak a tárgyak és a jelenetek az eltérő fény-, perspektíva- és mozgásviszonyok között.
Ez a videó alapú képzés – magyarázza a Venture Beat – lehetővé teszi a Magic Fixup számára, hogy olyan szerkesztéseket is elvégezzen, amelyek korábban kihívást jelentettek az MI-rendszerek számára. A felhasználók az egyszerű kivágás-beillesztés módszerrel durva módosításokat végezhetnek a képen. A Magic Fixup ezután értelmezi ezt a műveletet a kép újbóli létrehozásához, megfelelően finomítja a szerkesztéseket.
Egy dolog ugyanis elmozgatni tárgyakat a képen, de az már más kérdés, hogy valóban reálisan nézzenek ki az új helyükön. A mesterséges intelligencia viszont az új elrendezés által meghatározott megvilágításhoz és környezethez igazítja az áthelyezett objektumokat. „Modellünk kifejezetten lehetővé teszi a finom részletek átvitelét a forráskeretből a generált képbe, miközben szorosan követi a felhasználó által megadott elrendezést” – magyarázzák a kutatók. Ez a megközelítés teszi lehetővé a Magic Fixup számára, hogy rendkívül valósághű eredményeket produkáljon, amelyek szorosan illeszkednek a felhasználó szándékaihoz.
A Magic Fixup – leegyszerűsítve – két, egyidejűleg működő diffúziós modellre támaszkodik. Az egyik folyamat a referenciaképet kezeli, kihúzva az újra kreáláshoz szükséges részleteket, míg a másik a felhasználó durva szerkesztését és a referenciakép részleteit szintetizálja.
Bár a fejlesztés még csak korai szakaszában tart, az eredmények máris lenyűgözők. Az Adobe csapata által végzett felmérés szerint a felhasználók legalább háromnegyede előnyben részesítette ezt a módszert a legkorszerűbb eljárásokkal szemben a szerkesztések 80 százalékánál. Azt azért a kutatók is elismerik, hogy vannak még korlátok, mivel a modellnek meggyűlik a baja a kezekkel, arcokkal és apró tárgyakkal, de persze még a fejlesztésnek sincsen vége.
Meglepő módon, az Adobe kiadta a Magic Fixup kutatási kódját a GitHubon, és ez óriási változást jelent az Adobe mesterséges intelligencia-fejlesztési megközelítésében. Hagyományosan ugyanis a vállalat szigorúan őrizte saját algoritmusait és eszközeit. Ez a nyitottság viszont – jegyzi meg a Ventura Beat – felgyorsíthatja a hasonló technológiák fejlesztését az egész iparágban, ami potenciálisan az MI-alapú kreatív eszközök új generációjához vezethet.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.