tech

Új utat választott az Adobe a képmanipuláláshoz használt mesterséges intelligencia oktatására: videókat is bevett a tréninghez. Az MI ezután alkalmassá válik az egészen összetett képszerkesztési feladatok automatizálására.

A képszerkesztés éllovasa, az Adobe folyamatosan fejleszti a felhasználói számára kínált eszközöket. Kutatási részlegének, az Adobe Researchnek legújabb műve a Magic Fixup, amely az egészen összetett szerkesztési feladatok automatizálására hivatott.

Mint a legkorszerűbb képszerkesztő eszközöknél, a Magic Fixup mögött is mesterséges intelligencia áll, amelynek a betanítását azonban az eddigiektől eltérően végezték. Az Adobe mérnökei ugyanis úgy vélték, hogy egy ilyen eszköz jobban teljesíthet, ha nem fényképekkel, hanem videotartalmakkal oktatják őket – a Magic Fixup több millió videokockapárból tanult. Ez az újszerű módszer – írják a kutatók – lehetővé teszi az MI-technológia számára, hogy jobban megértse, miként változnak a tárgyak és a jelenetek az eltérő fény-, perspektíva- és mozgásviszonyok között.

Ez a videó alapú képzés – magyarázza a Venture Beat – lehetővé teszi a Magic Fixup számára, hogy olyan szerkesztéseket is elvégezzen, amelyek korábban kihívást jelentettek az MI-rendszerek számára. A felhasználók az egyszerű kivágás-beillesztés módszerrel durva módosításokat végezhetnek a képen. A Magic Fixup ezután értelmezi ezt a műveletet a kép újbóli létrehozásához, megfelelően finomítja a szerkesztéseket.

Egy dolog ugyanis elmozgatni tárgyakat a képen, de az már más kérdés, hogy valóban reálisan nézzenek ki az új helyükön. A mesterséges intelligencia viszont az új elrendezés által meghatározott megvilágításhoz és környezethez igazítja az áthelyezett objektumokat. „Modellünk kifejezetten lehetővé teszi a finom részletek átvitelét a forráskeretből a generált képbe, miközben szorosan követi a felhasználó által megadott elrendezést” – magyarázzák a kutatók. Ez a megközelítés teszi lehetővé a Magic Fixup számára, hogy rendkívül valósághű eredményeket produkáljon, amelyek szorosan illeszkednek a felhasználó szándékaihoz.

Balra az eredeti kép, középen a felhasználó szerkesztése, jobbra pedig a Magic Fixup változtatása látható

Adobe Research

A Magic Fixup – leegyszerűsítve – két, egyidejűleg működő diffúziós modellre támaszkodik. Az egyik folyamat a referenciaképet kezeli, kihúzva az újra kreáláshoz szükséges részleteket, míg a másik a felhasználó durva szerkesztését és a referenciakép részleteit szintetizálja.

Bár a fejlesztés még csak korai szakaszában tart, az eredmények máris lenyűgözők. Az Adobe csapata által végzett felmérés szerint a felhasználók legalább háromnegyede előnyben részesítette ezt a módszert a legkorszerűbb eljárásokkal szemben a szerkesztések 80 százalékánál. Azt azért a kutatók is elismerik, hogy vannak még korlátok, mivel a modellnek meggyűlik a baja a kezekkel, arcokkal és apró tárgyakkal, de persze még a fejlesztésnek sincsen vége.

Meglepő módon, az Adobe kiadta a Magic Fixup kutatási kódját a GitHubon, és ez óriási változást jelent az Adobe mesterséges intelligencia-fejlesztési megközelítésében. Hagyományosan ugyanis a vállalat szigorúan őrizte saját algoritmusait és eszközeit. Ez a nyitottság viszont – jegyzi meg a Ventura Beat – felgyorsíthatja a hasonló technológiák fejlesztését az egész iparágban, ami potenciálisan az MI-alapú kreatív eszközök új generációjához vezethet.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

mesterséges intelligencia

Már a kínai hadsereg is próbálgatja a DeepSeek MI-jét, igaz, egyelőre nem a harctéren

Kapott egy frissítést a beszélgetős ChatGPT, már nem vág a felhasználó szavába

Mestertervvel állt elő a Perplexity AI, hogy megszerezze a TikTokot

Hirdetés

Címkék

Ezt tudja a látványos képmanipuláló eszköz: töröl, cserél, hozzáad, amit csak kell – fotók

Mit tehetek én azért, hogy ne legyen baj a számítógépemen?

Magyar égre magyar csillagot? Jönnek az országonként különálló felhők?

És akkor megbénult 8,5 millió számítógép – Mennyivel van előrébb a világ most, és mi várható ezután?

DORA: biztonság, nem csak papíron

Már a kínai hadsereg is próbálgatja a DeepSeek MI-jét, igaz, egyelőre nem a harctéren

Kapott egy frissítést a beszélgetős ChatGPT, már nem vág a felhasználó szavába

Mestertervvel állt elő a Perplexity AI, hogy megszerezze a TikTokot

Ez a fülhallgató rázós helyzetben sem fog kiesni – teszten a Huawei FreeArc

Lázár következő nagy projektje: kancát keres Erdogan lovának

Ami a „zebragate” mögött van: 49 évet ment vissza az időben a Fidesz, hogy Magyar Péter félreállítására jogalapot találjon

Magyar Péter elindul Orbán választókörzetében országgyűlési képviselőjelöltként

Direkt36: Magyar Péter a konfrontatív stílusa és a túlzott önállósága miatt sodródott a NER partvonalára

Hajdú B. István: 1–6 után nem jó arcoskodni, 6–1 után meg nem elegáns

Kirúgják a dolgozók felét a kisbajcsi marhatelepről, ahol megjelent a száj- és körömfájás

Négy új járatot jelentett be a Wizz Air Budapestről

A falvak „identitását védi” a kormány, miközben elvett még egy fontos jogot az önkormányzatoktól

Pótcselekvés, megoldhatatlan, rémálom lesz – így néz ki az Orbán-féle választási adócsali

Amerikai politológusprofesszor: Zárják ki Magyarországot az EU-ból

Tarjányi Péter szerint a kormánynak egyelőre nincs megnyugtató válasza arra, hogy mit keresett egy kézigránát egy kormánytisztviselő kezében