tech

Nemcsak szövegből, képből is ért már a ChatGPT mögött dolgozó nyelvi modell, de a GPT-4 bevezetése után már szövegelés terén is jóval többet tud, mint eddig.

Mióta a ChatGPT híre elterjedt a világban, azóta a GPT-3 főverziószámú nagy nyelvi modell dolgozott mögötte. Bár az OpenAI mérnökei folyamatosan finomították – így lett például GPT-3.5 –, de a nagy újítás csak kedden este vált hivatalossá: a mesterségesintelligencia-platform mögött azóta a GPT-4 üzemel. Az amerikai vállalat szerint az új modell által kreatívabb és együttműködőbb lett a ChatGPT, és bonyolultabb problémák eddiginél pontosabb megoldására is képes.

Az eddigi 3000 szavas korlát 25 ezresre változott: egy utasításban legfeljebb ilyen terjedelmű szöveg adható meg a platformnak, amely válaszában is legfeljebb ennyit képes generálni.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023

Látványos változás, hogy szöveg mellett már képi bemenet is adható a rendszernek, input oldaláról tehát multimodális. De fontos, hogy válaszolni egyelőre továbbra is csak szöveges formában képes.

Ennek nagyszerűsége a fejlesztők példája alapján könnyedén belátható. Ha valaki beadja a rendszernek az alább látható képet, majd mindenféle szöveges magyarázat nélkül megkérdezi a ChatGPT-től, mi fog történni, ha leesik a kesztyű, a mesterséges intelligencia érti, hogy az előbb megmutatott képre vonatkozik a kérdés, felismeri, hogy azon melyik a kesztyű, látja és érti a többi objektum elrendezését, és a fizikai törvényei alapján ki is tudja következtetni, hogy ebben az esetben a kesztyű megüti a deszkát, melynek hatására a labda felrepül.

képernyőkép / hvg.hu

Az OpenAI hangsúlyozza, hogy a GPT-4 által hajtott ChatGPT továbbra sem tévedhetetlen, de „áttörést hoz a mesterséges intelligencia problémamegoldó képességében”.

Bejelentésében a vállalat több mint kéttucat különféle jellegű vizsgáról tesz említést, melyeket korábban a GPT-3.5 verzió és a most GPT-4-es is megpróbált teljesíteni. A közreadott grafikonon a kék szín a ChatGPT mögött eddig dolgozó GPT-3.5 modell teljesítményt jelöli. A világos zöld azt, hogy hány százalékot ért el a GPT-4, ha nem használhatta új vizuális képességeit, ahol látható sötétzöld színezés is, ott pedig annyi történt, hogy a képértelmezés mennyit tett hozzá a GPT-4 teljesítményéhez. (A részletes vizsgaeredményeket itt találja.)

OpenAI

Az OpenAI azt is bejelentette: a ChatGPT mögé berakás mellett a GPT-4 képességeit már olyan partnerei számára is elérhetővé tette, mint a Duolingo vagy a Khan Academy. Azt pedig a Microsoft erősítette meg, hogy az új Bing kereső alatt a GPT-4 fut, azt optimalizálták kifejezetten webes keresési élményhez.

Alapvetően fog megváltozni, ahogy internetezünk - nagy élmény lesz, nagy kérdésekkel
Nem azért pánikolnak a Google-nál a ChatGPT miatt, mintha ők nem tudnának hasonlót fejleszteni. Hanem mert egyelőre nem látszik, hogyan lehet majd pénzt facsarni a keresésekből az új világban. Minél közelebb próbálunk jutni a válaszhoz, annál több kérdés merül fel.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.