Jelentős állomásához érkezett az OpenAI mesterséges intelligenciával kapcsolatos fejlesztése: az egyik új MI-modell az emberi teljesítménynek megfelelő eredményeket produkált egy olyan tesztben, amellyel az „általános intelligenciát” mérik.
Közvetlenül karácsony előtt jelentette be a mesterséges intelligencia keltette hullámok indítója, az OpenAI, hogy o3 rendszere 85 százalékos eredményt ért el az ARC-AGI benchmarkon (ami kifejezetten a mesterséges általános intelligencia, azaz az AGI és az emberi általános intelligencia összehasonlítására szolgál), és ez jóval meghaladja korábbi 55 százalékos eredményét. A 85 százalék immár megegyezik az emberek által elért átlagos pontszámmal.
Hogy mi a jelentősége? Technikai értelemben az ARC-AGI benchmark egy MI-rendszer „mintahatékonyságának” tesztje az új dolgokhoz való alkalmazkodásban, másként fogalmazva: hány példát kell látnia egy új helyzetre a rendszernek, hogy rájöjjön, hogyan is működik.
A ChatGPT (GPT-4), nem túl hatékony ebből a szempontból: emberi szövegek milliói példáján tanították, valószínűségi „szabályokat” alkotva arra vonatkozóan, hogy mely szavak kombinációi a legvalószínűbbek. Ez a ritkábban előforduló feladatoknál nem igazán sikeres, hiszen kevesebb adattal rendelkezik a problémával kapcsolatban. Amíg a mesterséges intelligencia rendszerek nem tudnak tanulni kis számú példából, addig csak nagyon ismétlődő munkákhoz használják ezeket, illetve olyanokhoz, ahol az alkalmi meghibásodás elviselhető.
A korábban ismeretlen vagy újszerű problémák korlátozott adatmintákból történő pontos megoldásának képességét általánosítási képességnek nevezik. Széles körben az intelligencia szükséges, sőt alapvető elemének tartják és ebben az emberek általában jól teljesítenek. Jó példa az ilyen típusú feladatokra egy olyan IQ teszt, ahol három ábra alapján kell kitalálni egy negyediket. Ebben az általánosításban ért el nagyon jó eredményt az o3 rendszer. Rendkívül alkalmazkodóképesnek bizonyult, néhány példa alapján általánosítható szabályokat talált.
Egyelőre csak találgatások vannak azzal kapcsolatban, hogy miként érte el az OpenAI, pontosabban az o3 ezt az eredményt. Az említett benchmarkot tervező francia mesterséges intelligencia-kutató, Francois Chollet úgy véli, hogy az o3 különböző „gondolatláncokon” keres, leírva a feladat megoldásának lépéseit. Ezután a „legjobbat” választja ki valamilyen lazán meghatározott szabály vagy „heurisztika” (felismerésre rávezető módszer) szerint.
Az o3-ról most még alig tudni valamit, ugyanis az OpenAI csak néhány médiabemutatón tett róla említést, és csak néhány kutató, laboratórium és mesterséges intelligencia-biztonsági intézmény számára tette lehetővé a korai tesztelést. Így tehát meg kell várni a megjelenését (amit egyébként az év elejére ígérnek), hogy sokkal jobb elképzelés legyen arról, hogy tényleg olyan alkalmazkodóképes-e, mint egy átlagos ember. Ha igen, akkor az az önfejlesztő felgyorsult intelligencia új korszakát nyithatja meg, és komolyan megfontolandó lesz, hogyan kellene egy ilyen MI-t irányítani. Ha pedig mégsem, akkor ez a mostani még mindig lenyűgöző eredmény marad, azonban nem sokat változtat a mindennapi életen.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.