A Google Gemini 1.5 Pro néven mutatta be az új mesterséges intelligenciát (MI), amelyből elérhetővé tesz ingyenes és előfizetéses verziót is. Utóbbi látványosan nagyobb teljesítménnyel dolgozik.
A Google az elmúlt hetekben több változást is eszközölt a mesterségesintelligenci-portfóliójában. A 2023 elején bejelentett Bard nevű chatbotot Geminire nevezte át, ami így a tavalyi év végén bejelentett modell nevét vette fel.
Emellett azt is közölte a vállalat, hogy az ingyenes mellett jön a több/jobb képességekkel rendelkező fizetős verzió is. Ehhez kapcsolódik a magyar idő szerint csütörtök este bejelentett újdonság, a Gemini 1.5 Pro, amely a Google szerint az előző modellhez képest „drámailag megnövelt teljesítménnyel” áll a felhasználók rendelkezésére.
Sundar Pichai, a Google vezérigazgatója és Demis Hassabis, a Google mesterséges intelligenciát fejlesztő DeepMind részlegének igazgatója igyekezett leszögezni, hogy a mesterséges intelligencia határainak feszegetése a biztonság szem előtt tartásával történik. Mindezt azért is tartották fontosnak kiemelni, mert az MI-vel kapcsolatban van egy általános szkepticizmus/félelem, hogy előbb-utóbb irányíthatatlanná válik.
Emellett ugyanakkor hangsúlyozni kellett azt is a befektetők, leendő ügyfelek felé, hogy a Google egyre nagyobb hangsúlyt fektet a fejlesztésekre és a piacvezető szerep megszerzésére azután, hogy az OpenAI által fejlesztett ChatGPT megjelenésekor némiképp elaludt a vállalat.
Pichai és Hassabis szerint a Gemini 1.5 Pro az alig egy hete bejelentett modell, a Gemini 1.0 Ultrával összehasonlítható eredményeket nyújt. Az új fejlesztés azonban hatékonyabb válaszokat nyújt kisebb számítási kapacitás mellett. Képes dolgozni hanggal, szöveggel, képpel, videóval és forráskóddal is.
A Gemini 1.5 Pro képes egyszerre 700 ezer szót, 60 perc videót, 11 órányi hanganyagot vagy 30 ezer sorból álló forráskódot is feldolgozni. A Google azt állítja, hogy egy hosszú szövegbe beszúrt adatot a mesterséges intelligencia ez estek 99 százalékában képes volt „kiérteni”, megtalálni.
A rendszer emellett képes részleteket kifejteni az Apollo 11 küldetés 402 oldalas leiratából, valamint pontosan meghatározni Buster Keaton egy 44 perces némafilmjének főbb cselekménypontjait. A cég szerint az újdonság képes arra is, hogy új készségeket sajátítson el: megtanult például kalamang nyelven, amit a világon nagyjából 200 ember beszél.
Hassabis szerint a Gemini 1.5 Prót visszafogott teljesítménnyel dobják piacra, de különböző előfizetői csomagok vásárlásával jobb képességeket is választhatnak majd az ügyfelek.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.