Az ígéret szerint a legtöbb területen a ChatGPT-nél is fejlettebb a Google teljesen új nyelvi modellje, mely új lökést adhat a cég mesterségesintelligencia-megoldásainak. Érkezik a még okosabb Bard, de a Gemini által az okostelefonok is új képességeket kaphatnak rövidesen.
Ki emlékszik még arra, amikor a Google-nél megnyomták a pánikgombot a mesterséges intelligencia miatt a ChatGPT hajnalán? Azóta eltelt egy év, és maga a Google is fel tudott mutatni eredményeket a területen, legyen szó a keresője felokosításáról vagy a Bard chatbotról.
Az igazi nagy durranás azonban eddig váratott magára, a cég lerántotta a leplet a Gemini 1.0 nevű új nyelvi modelljéről (LLM), ami például a Bardot is felokosítja majd – és többre lehet képes, mint a ChatGPT jelenlegi legfejlettebb verziója mögött dolgozó modell.
Az újdonságot maga Sundar Pichai, a Google (Alphabet) vezérigazgatója és Demis Hassabis, a céghez tartozó, MI-fejlesztésekre szakosodott DeepMind első embere mutatta be egy blogposztban. Rögtön három változat/méret is érkezik: Ultra, Pro, Nano.
A Geminit az alapoktól egy multimodális modellként fejlesztették, azaz többféle input (bemenet) is adható neki, a szöveges mellett képi, videós, sőt, hangalapú is. Ezzel komplex érvelő feladatokat is meg tud oldani a rendszer, ahogyan akár fizikával kapcsolatos dolgokat is képes abszolválni.
Visszakanyarodva a három változathoz – Nano, Pro és Ultra –, ezek az egyes modellek méretét takarják.
A Nano, mint már a neve is sejteti, kisebb eszközökön végzendő feladatokra van méretezve, ezt fogják megkapni az okostelefonok is – első körben a Google saját, Pixel 8-as mobiljai.
A következő lépcső a Pro, melyet már a Google különböző szolgáltatásaiba fognak integrálni, például a Bardba. Ezzel utóbbi chatbot a cég szerint még jobb lesz az érvelésben, tervezésben és a megértésben is.
A Gemini Próval felturbózott Bard minden országban elérhető lesz, ahol a chatbotot eddig is használni lehet, így Magyarországon is használható lesz az okosabb MI. 2024-ben érkezni fog egy még komolyabb változat is, amint befut a Gemini Ultra – ez lesz a Bard Advanced, mely már fizetős lesz, de ennél többet egyelőre nem tudni róla.
Az Ultra azért nem lesz elérhető (legalább) 2024-ig, mert még további tesztelést igényel – de ez nem is kimondottan a hétköznapi felhasználókat célozza, a képességei ugyanis elképesztőek lesznek az ígéret szerint.
Végezetül, a Gemini az MI-k egyik népszerű területén, a kódolásban is jeleskedik; olyan programnyelveket ismer, mint a Python, Java, C++ és a Go. A modellből még egy speciális változat is készül erre a feladatra AlphaCode 2 néven.
A jelek szerint tehát a Google – mely egyébként régóta aktívan foglalkozik az MI területével – maga is felzárkózott a konkurensekhez, sőt: a kiadott eredmények szerint a Gemini Ultra szinte mindenben jobb lesz, mint a ChatGPT mögött álló, jelenleg elérhető legfejlettebb OpenAI nyelvi modell, a GPT-4. Az egyetlen hátulütője, hogy jelen pillanatban csak angol nyelven működik.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.