Átment a Turing-teszten az OpenAI által fejlesztett modell, a GPT-4.5: az esetek 73 százalékéban képes volt elhitetni az emberrel, hogy nem robottal, hanem egy másik emberrel beszélget.
Míg néhány évvel ezelőtt még viszonylag könnyen meg lehetett mondani egy csevegésről, hogy a másik oldalon gép vagy ember írja az üzenetet, ma már ez nem egyértelmű. Olyannyira nem, hogy az egyik legjobb mesterségesintelligencia-modellt, ami jelenleg a piacon van, az OpenAI által fejlesztett GPT-4.5-ről a tesztelők – a Turing-teszt frissített változatában – többször gondolták azt, hogy ember, mint azt, hogy robot.
A Turing-teszt arra szolgál, hogy mérje a gépi intelligenciát, illetve, hogy a felhasználók észlelik-e, hogy egy géppel van dolguk. A Kaliforniai Egyetem kutatói ezért ezt a módszert választották a vizsgálatukhoz: Turing-tesztet végeztek nagyjából 300 ember bevonásával – írja a BGR. Az eredményeiket az arXiv preprint szerveren tették közzé.
A tanulmány során a résztvevőknek egyszerre kellett beszélgetniük a robottal és az emberrel, és el kellett dönteniük, hogy melyik üzenetet ki küldte. Amikor a GPT-4.5-öt arra utasították, hogy úgy beszéljen, mint egy popkultúrában jártas fiatal felnőtt, az esetek 73 százalékában képes volt elhitetni a felhasználókkal, hogy ő egy ember. Ez messze meghaladja az 50 százalékos esélyt, amit a kezdetektől fogva a Turing-teszt sikerességi küszöbeként határoztak meg a szakemberek. Érdekes módon az emberi csevegőtársak kevésbé voltak sikeresek abban, hogy meggyőzzék a résztvevőket arról, hogy ők az emberek.
A kísérlet más modelleket is tesztelt, köztük a Meta LLaMA 3-at és az OpenAI újabb GPT-4o-t, valamint az ELIZA-t, a valaha kifejlesztett egyik legkorábbi chatbotot. Nem meglepő módon azok a mesterséges intelligenciák, amelyeknek nem lehetett megmondani, hogy milyen karakter bőrébe bújva kommunikáljon, sokkal rosszabbul teljesítettek. A GPT-4.5 pontossága 36 százalékra esett vissza a karakter meghatározása nélkül, a GPT-4o pedig mindössze 21 százalékot ért el.
A BGR megjegyzi: nem ez az első alkalom, hogy a kutatók a mesterséges intelligenciát Turing-tesztnek vetik alá, de ezek az eredmények azt mutatják, hogy bár a nyelvi modellek nem úgy „gondolkodnak”, mint az emberek, egyre inkább képesek az emberi „viselkedésre” a rövid, kötetlen beszélgetésekben.
A kutatók szerint az, hogy a mesterséges intelligencia sikerrel teljesítette a Turing-tesztet nem jelenti azt, hogy a modell olyan értelmes, mint az emberek. Ugyanakkor az, hogy ennyire meggyőzőek tudnak lenni azt is jelenti, hogy érdemes sokkal körültekintőbbnek lenni, ha valaki egy ismeretlennel kezd el beszélgetni.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának tudományos felfedezésekről is hírt adó Facebook-oldalát.