Az év legfontosabb találmányai között – idén már írhatjuk: természetesen – ott vannak a mesterséges intelligencia kategóriájába tartozó újdonságok is. Íme a TIME magazin 200-as találmánylistájának MI-szekciója.
A legnagyobb chip
A mesterséges intelligencia futtatásához a számítógépeknek hatalmas mennyiségű adatot kell mozgatniuk a különálló memória és a logikai chipek között, ami lényegében visszafogja a teljesítményt. A probléma megoldására a Cerebras Systems 2019-ben kidolgozott egy tányér méretű processzort, ami magában foglalja a memóriát és a logikai chipet is.
A cég 2014 márciusában már a harmadik generációját adta ki a fejlesztésnek, a Wafer-Scale Engine 3-at (WSE-3), ami minden korábbi megoldásnál gyorsabb lett. Olyannyira gyors, hogy az OpenAI által készített GPT-4-nél tízszer nagyobb modellt is képes betanítani. Ezek alapján nem csoda, hogy hamarosan egy új szuperszámítógépben, a Texasban készülő Condor Galaxy 3-ban kaphat majd helyet.
Gyógyszerkutatás
A Google DeepMind még 2020-ban mutatta be az AlphaFold 2-t, egy gépi tanuló algoritmust, ami eddig soha nem látott, a kísérleti módszerekkel is versenyre kelő pontossággal képes előre jelezni a fehérjék szerkezetét. A fejlesztés annyira fontos volt, hogy 2024-ben a két fejlesztőjét, Demis Hassabist és John M. Jumpert – David Baker mellett – kémiai Nobel-díjjal jutalmazták.
A fejlesztés azóta sem állt le, így 2024 májusában megjelent az AlphaFold 3. Az algoritmus már nem a fehérjék szerkezetét jósolja meg, hanem azt, hogy miként képesek kölcsönhatásba lépni más molekulákkal és a DNS-sel. A szakemberek szerint az új modell előrejelzései felgyorsítják a kutatást a gyógyszeriparban és az orvostudományban is.
Szédítő videók
A Runway nevű vállalat 2024 májusában mutatta be a Gen-3 Alpha nevű mesterségesintelligencia-modelljét, ami képes 10 másodperces videók készítésére szöveg, fotó vagy videó alapján. Az eszközt elsősorban a filmstúdiók számára készítették, hogy a filmkészítés folyamatát megkönnyítsék.
A Lionsgate filmstúdió nem sokkal később engedélyt adott a vállalatnak, hogy a több mint 20 ezer filmcímet tartalmazó adatbázisán tanítsa be a modelljét. A rendszert később többek között storyboardok és speciális effektek kidolgozására is felhasználná a stúdió.
Üröm az örömben, hogy a Runway egyik volt alkalmazottja állítja: a cég ezrével lopott videókat a YouTube-ról, hogy kifejlessze a Gen-3-at.
SzereleMI
A Forbes Health júliusi felmérése szerint a megkérdezettek 78 százaléka úgy érzi, hogy már csalódott a társkereső alkalmazásokba. Az egyik közülük Roman Khaves, aki épp egy társkereső alkalmazás, a Rizz társtulajdonosa. Ez azonban nem egy hagyományos randi app.
Khaves és társa, Joshua Miller a mesterséges intelligenciát, egész pontosan a ChatGPT-t integrálták a rendszerükbe, hogy amikor beszélgetni kell a kiszemelttel, és elakadnak a társalgásban, akkor legyen, ami átsegíti őket a nehézségen. A használt modellt a társkeresésre specializálódott szakemberek segítségével tanították be, és ha valaki képernyőképet küld a rendszernek egy beszélgetésről, akkor az segít megmondani, hogy érdemes-e felvetni egy személyes találkozót, vagy nincs értelme tovább beszélgetni az illetővel.
Mivel a rendszer képernyőképekkel dolgozik, így bármilyen platformon folyó csevegést el lehet neki küldeni.
A Rizz mostanra az Egyesült Államok legtöbbször letöltött randialkalmazása, havonta 1,5 millió aktív felhasználója van. Szerencsére Magyarországon is elérhető, androidosok innen, iPhone-osok innen tölthetik le.
Munkatárs
A generatív mesterséges intelligencia megjelenésével megszokottá vált, hogy egy ilyen rendszer képes összefoglalót írni egy dokumentumból, emberi nyelven csevegni vagy épp megadott utasítások alapján képeket generálni. Ez utóbbi képességekre azonban a vállalkozások zömének nincs szüksége, ezt pedig a kanadai Cohere nevű vállalat is felismerte.
A cég egy olyan MI-t készített – ez lett a Command R+ –, ami nem tartalmazza a felesleges képességeket, viszont minden olyan feladatot el tud látni, amire egy vállalkozásnak szüksége lehet. Ilyen a dokumentumok összefoglalása, az azzal kapcsolatos kérdések megválaszolása – akár több nyelven is –, vagy épp a számológép használata egy matematikai számítás elvégzéséhez.
A rendszer már több nagy vállalat, például az Oracle érdeklődését is felkeltette.
Tényellenőrzés
Az álhírek világában nagyon fontos lenne, hogy az ember tisztában legyen a valósággal. Ezt az igényt igyekszik kielégíteni a szingapúri startup cég, az AI Seer, amely egy mesterséges intelligenciára épülő tényellenőrző eszközt hozott létre: a Facticity.AI-t.
A vállalat szerint az eszköz 92 százalékos pontossággal szúrja ki az álhíreket, szemben például a Bing CoPilot 72 százalékával. Jacob Kozhipatt, a Business Insider korábbi újságírója azt mondta, lenyűgözte a szoftver, és az, hogy „mennyivel többet és mennyivel gyorsabban tudja ellenőrizni a tényeket, mint az emberek”.
A cég a jövőben a Wordhöz és a Google Chrome-hoz is készít olyan bővítményt, ami írás közben ellenőrzi a tényeket.
Segítség az ápolóknak
A Laguna Health nevű startup cég fejlesztése egy egészen más területen igyekszik pozitív változást hozni: a betegellátásban. Gyakran előfordul, hogy miután az emberek kikerülnek a kórházból, ápolásra szorulnak. Az emberekkel való munka azonban sokszor nem egyszerű, ezért a Laguna Insight nevű mesterséges intelligenciával igyekszik a cég támogatni ezt a folyamatot.
A rendszer amellett, hogy gördülékenyebbé teszi a munkát – például összefoglalót ad az ápolóknak a betegekről, mielőtt felhívnák őket –, abban is segít, hogy a megfelelő empátiával és stílusban tudjanak beszélni a segítségre szorulókkal. Ez nemcsak a betegek hangulatát javíthatja, de segíthet abban is, hogy az ápolók kevésbé égjenek ki a munkájuk során.
Életmentő előrejelzés
A Google anyacégének, az Alphabetnek egyik inkubátorában hozták létre a szakemberek azt a projektet, ami a mesterséges intelligenciára támaszkodva igyekszik megjósolni, mekkora a valószínűsége egy adott területen annak, hogy természeti katasztrófa következik be.
A Bellwether nevű rendszer a geoadatok 600 különböző rétegét elemzi, beleértve a növényzetet, a szélsebességet és a csapadék mértékét. A modellt 20 év adataival tanították be, és az adott területre vonatkozóan több ezer „mi lenne, ha” forgatókönyvet képes lefuttatni, hogy kiderüljön: mekkora az esélye egy árvíznek, tűzvésznek vagy más természeti katasztrófának. Ha pedig magas, akkor az milyen pusztítást végezhet.
Sarah Russell, a Bellwether alapítója szerint a rendszert a kormányok mellett a biztosítók is használhatják, hogy felmérjék egy adott terület kockázatát.
Ellenőrzés
Ellenőrizni nemcsak a tényeket, de a chatbotokat – pontosabban az azok által adott válaszokat – is érdemes. A McKinsey felmérése szerint a megkérdezett szervezetek csaknem negyede válaszolt úgy, hogy már volt negatív következménye annak, hogy egy chatbot pontatlan választ adott.
Itt jön képbe az izraeli Aporia fejlesztése, a Guardrails, ami segí ellenőrizni a chatbotok által adott válaszokat, hogy fény derüljön a pontatlanságukra. Emellett a jelenleginél jobb adatvédelmet kínálnak a vállalatoknak, és a mesterséges intelligencia manipulálására tett kísérleteket is igyekszik letörni.
Liran Hason, az Aporia társalapítója és vezérigazgatója szerint a vállalat célja, hogy az emberiség tényleg megbízhasson a mesterséges intelligenciában.
Tehermentesítés
Fentebb már szó esett egy olyan eszközről, ami az ápolók válláról igyekszik levenni a terhet. Természetesen olyan mesterséges intelligencia is készült már, ami az orvosokkal tenné ugyanezt: csökkentené az adminisztrációval töltött idejüket.
Shiv Rao, az Abridge AI alapítója és vezérigazgatója szerint a felmérések azt mutatják, hogy az orvosok átlagosan heti 15,5 órát töltenek papírmunkával, ami rengeteg idő, főleg akkor, ha épp valamilyen járványhelyzetben kell dolgozniuk.
A cég által fejlesztett rendszer segít rögzíteni a betegekkel folytatott beszélgetést, abból összefoglalót készít, így pedig könnyebb és gyorsabb lehet az adminisztráció is. A megoldást az amerikai egészségügyi rendszerre szabták, ahol jelenleg már 50 ezer orvos használja.
Könnyített PDF
A becslések szerint 3 billió PDF fájl létezhet, ami alapján nem nehéz azt elképzelni, hogy az ember igen sűrűn találkozik ilyen dokumentummal. Az Adobe ezért egy olyan eszközt fejlesztett ki, ami a mesterséges intelligencia segítségével teszi könnyebbé a dokumentum átfutását.
Az Adobe Acrobat AI Assistant segítségével valós időben lehet kérdezni a mesterséges intelligenciát egy adott PDF-ről, a rendszer pedig összefoglalókat készít és tényeket közöl a dokumentumról, valamint segít megmagyarázni egy-egy abban található nehezebb kifejezést.
Az MI, ami mindent megmagyaráz
A Google Labs még 2023 júliusában adta ki a mesterséges intelligenciára épülő NotebookLM-et, ami segíti a felhasználókat a dokumentumok feldolgozásában. A segítségével a felhasználók megérthetik az összetett információkat ahelyett, hogy akár 50 különböző forrást – könyveket, cikkeket, YouTube-videókat – kellene végigböngészniük a válaszokért. Ezeket a rendszer összefoglalja, és képes akár egy tanulmány készítéséhez is útmutatót adni.
A cég 2024 szeptemberében adott ki egy új funkciót a rendszerhez, ami az összegyűjtött adatokat képes podcasttá alakítani, aminek műsorvezetőjét is az MI hozza létre.
Steven Johnson, a Google Labs egyik igazgatója szerint 30 évet töltött azzal, hogy egy olyan digitális eszközt hozzon létre, ami segít megérteni egy adott témát.
Segítség a marketingeseknek
A marketingesek gyorsan felültek a generatív mesterségesintelligencia-vonatra, hogy a kiadott rendszereket a tartalmak készítésére használják. Abhay Parasnis, az Adobe korábbi vezetője, a Typeface nevű cég alapítója és vezérigazgatója azonban úgy véli, hogy a legtöbben csak a felszínt kapargatják, és nem használják ki a benne rejlő lehetőségeket.
A cég májusban adta ki a Typeface Arc nevű fejlesztést, ami nem csupán e-mailt vagy egy közösségi oldalra szánt bejegyzést ír meg, hanem képes megtervezni egy teljes kampányt. Ehhez elég csak megadni a kitűzött célt, a rendszer pedig a korábbi kampányokból tanulva elkészíti az adott stratégiát.
Kinyílt a világ
A New York-i Captions nevű cég pontosan azt adja a felhasználóknak, ami az internet lényege: elérhetőséget a világ összes internetezője számára. Az azonos nevű platform a mesterséges intelligenciára épülve egyszerűsíti a videókészítést: kivágja a szüneteket a felvételből, valamint segít, hogy a tartalomgyártó tartsa a szemkontaktust.
A technológia mögött a júliusban kiadott Lipdub 2.0 nevű modell dolgozik, ami valósághű avatárokat hoz létre, majd velük készíti el az adott tartalmat. Emellett a felhasználó létrehozhatja a saját „MI ikertestvértét” is, lehetővé téve, hogy a videóban ő szerepeljen.
A modell igazi különlegessége, hogy több tucat nyelvre képes szinkronizálni a videót, amihez még a karakter szájmozgását is az adott nyelvhez igazítja.
A Captions a világ 180 országában érhető el: androidosok innen, iPhone-osok innen tölthetik le, de van webes felülete is.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.