Érvelésben, kódolásban, és többlépéses problémák megoldásában is jobb lett az o1 nevű OpenAI modell a cég korábbi modelljeihez képest, de azért még ez sem tökéletes.
Újabb nagy nyelvi modellt mutatott be az OpenAI. Az o1 nevet viselő mesterséges intelligencia Sam Altman, a cég vezérigazgatója szerint „egy új paradigma kezdete”, mert képes komplex érvelésre is – bár továbbra is megvannak a maga korlátai.
Mint a Gizmodo a bejelentést összegezve kiemeli: amikor az o1-modelleknek (mert lesz egy o1 mini is) feltesznek egy kérdést, az MI-k az emberek gondolkodási technikáját utánozzák. Ráadásul a modellek a háttérben is ellenőrzik a válaszaikat, mielőtt még a felhasználó elé tárnák azokat. „Megtanulja, hogyan bontsa egyszerűbbekre a bonyolult lépéseket – és megtanul megpróbálni egy másik megközelítést, ha az aktuális nem vált be” – magyarázza az OpenAI.
Az új technikák, bár számos mutatóban hoznak jobb teljesítményt, még mindig nem teszik tökéletessé a modellt. Az OpenAI szerint az esetek kis számában akár az o1-modellek szándékosan is félrevezethetik a felhasználókat.
A cég saját tesztjei szerint 100 000 beszélgetésből 800 esetben adott helytelen választ az modell előzetes változata. Ráadásul ezen helytelen válaszok körülbelül harmadát annak ellenére adta meg az o1, hogy a modell gondolatlánca azt mutatta: tudatában van annak, hogy ez a válasz nem jó. A hallucinációktól tehát ez a modell sem mentes még.
Mindent összevetve azonban az újdonság jobban teljesített, mint a GPT-4o, az eddigi csúcsmodell. Egy programozóverseny kérdéseit 89 százalékos helyességgel válaszolta meg, míg a Nemzetközi Matematikai Diákolimpia kérdéseit 83 százalékos eredménnyel teljesítette. Utóbbinál a GPT-4o csúnyán elvérzett, mindössze 14 százalékot ért el korábban.
A The Verge megjegyzi: a modell az egyik első lépés azon cél felé, hogy elkészüljön egy emberszerű mesterséges intelligencia.
Arról nem közölt részleteket az OpenAI, hogy milyen adatokon képezte az o1-et – annyit árult csak el, hogy nyilvános, valamint partneri megállapodások révén szerzett adatokról van szó.
Az új modellhez már hozzáférnek a ChatGPT Plus és Team előfizetői, míg a vállalati és oktatási felhasználóknál jövő héten jelenik meg az o1 előzetes változata. A „mini” variáns valamikor az ingyenes felhasználóknak is meg fog jelenni – de hogy mikor, az jelenleg nem ismert.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.