Tech HVG 2024. szeptember. 13. 14:03

Válasz előtt gondolkodik is az OpenAI új mesterséges intelligenciája

Érvelésben, kódolásban, és többlépéses problémák megoldásában is jobb lett az o1 nevű OpenAI modell a cég korábbi modelljeihez képest, de azért még ez sem tökéletes.

Újabb nagy nyelvi modellt mutatott be az OpenAI. Az o1 nevet viselő mesterséges intelligencia Sam Altman, a cég vezérigazgatója szerint „egy új paradigma kezdete”, mert képes komplex érvelésre is – bár továbbra is megvannak a maga korlátai.

Mint a Gizmodo a bejelentést összegezve kiemeli: amikor az o1-modelleknek (mert lesz egy o1 mini is) feltesznek egy kérdést, az MI-k az emberek gondolkodási technikáját utánozzák. Ráadásul a modellek a háttérben is ellenőrzik a válaszaikat, mielőtt még a felhasználó elé tárnák azokat. „Megtanulja, hogyan bontsa egyszerűbbekre a bonyolult lépéseket – és megtanul megpróbálni egy másik megközelítést, ha az aktuális nem vált be” – magyarázza az OpenAI.

Dolgozatokhoz is használhatták a magyar egyetemisták az MI-t, katasztrofális vége lett a kísérletnek

Csökkent a hallgatók tudásszintje és motivációja, nőtt a köztük lévő társadalmi egyenlőtlenség – a Corvinus egyetem két oktatója, Benedek Márton és Sziklai R. Balázs tanulságos kísérletbe fogott, amikor megengedték hallgatóiknak, hogy használják tanulmányaikhoz a ChatGPT-hez hasonló mesterséges intelligenciákat. Az eredmény lesújtó lett. Interjú.

Az új technikák, bár számos mutatóban hoznak jobb teljesítményt, még mindig nem teszik tökéletessé a modellt. Az OpenAI szerint az esetek kis számában akár az o1-modellek szándékosan is félrevezethetik a felhasználókat.

A cég saját tesztjei szerint 100 000 beszélgetésből 800 esetben adott helytelen választ az modell előzetes változata. Ráadásul ezen helytelen válaszok körülbelül harmadát annak ellenére adta meg az o1, hogy a modell gondolatlánca azt mutatta: tudatában van annak, hogy ez a válasz nem jó. A hallucinációktól tehát ez a modell sem mentes még.

Coding with OpenAI o1

Say hello to OpenAI o1-a new series of AI models designed to spend more time thinking before they respond. This new series of AI models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. More here: www.openai.com/o1

Mindent összevetve azonban az újdonság jobban teljesített, mint a GPT-4o, az eddigi csúcsmodell. Egy programozóverseny kérdéseit 89 százalékos helyességgel válaszolta meg, míg a Nemzetközi Matematikai Diákolimpia kérdéseit 83 százalékos eredménnyel teljesítette. Utóbbinál a GPT-4o csúnyán elvérzett, mindössze 14 százalékot ért el korábban.

Math with OpenAI o1

Say hello to OpenAI o1-a new series of AI models designed to spend more time thinking before they respond. This new series of AI models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. More here: www.openai.com/o1

A The Verge megjegyzi: a modell az egyik első lépés azon cél felé, hogy elkészüljön egy emberszerű mesterséges intelligencia.

Arról nem közölt részleteket az OpenAI, hogy milyen adatokon képezte az o1-et – annyit árult csak el, hogy nyilvános, valamint partneri megállapodások révén szerzett adatokról van szó.

Az új modellhez már hozzáférnek a ChatGPT Plus és Team előfizetői, míg a vállalati és oktatási felhasználóknál jövő héten jelenik meg az o1 előzetes változata. A „mini” variáns valamikor az ingyenes felhasználóknak is meg fog jelenni – de hogy mikor, az jelenleg nem ismert.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Kult HVG 2024. november. 26. 20:00

"Amit mi csinálunk, az hosszútávfutás" – színfalak mögött az Ivan & The Parazollal

Néhány napon belül több helyen és több helyzetben is találkoztunk a jövőre hatodik nagylemezét megjelentető Ivan & The Parazollal, hogy megtudjuk, mitől különleges a zenekar új nagylemeze, hogyan áll most a 14 éves zenekar, mi történt velük az elmúlt években, és miért gondolják azt, hogy eljött az együttes aranykora. A HVG kisfilmje.