A gondolatolvasás új szintjét jelentheti a technológia, amit szingapúri és hongkongi tudósok fejlesztettek ki. Az algoritmus sokkal pontosabb, mint bármi, amit eddig ezen a téren alkottak.
A mesterséges intelligencia fejlődésével egyre izgalmasabb kérdés, hogy lehet-e olyan technológiát készíteni, amely képes olvasni az ember gondolataiban. A jelek szerint igen: nemrég a Texasi Egyetem tudósai értek el áttörést ezen a téren: betolták egy fMRI-gépbe az önkénteseket, az MI pedig kiolvasta, mire gondolnak. Most pedig a Szingapúri Nemzeti Egyetemen és a Hongkongi Kínai Egyetem tudósai álltak elő egy igen izgalmas eredménnyel.
A kutatók a mesterséges intelligenciát használták fel arra, hogy az agyhullámok monitorozásával rekonstruáljanak egy videót, amit a tesztalany látott. Az erről szóló tanulmány egyelőre az arXiv preprint szerveren olvasható.
Módszerük hasonló volt ahhoz, mint amit a Texasi Egyetemen végeztek. Az önkénteseket funkcionális mágneses rezonanciavizsgálatnak (fMRI) vetették alá – ezzel figyelték az agyhullámokat a kutatók –, miközben videót nézettek velük.
Ez nem egyszerű feladat. A nem invazív eszközökkel rögzített agyhullámoknál interferencia jelentkezhet, ami torzítja a kiolvasott információt. Ráadásul a videó 30 képkocka/másodperccel pörög az ember szeme előtt, így ahhoz, hogy egy 2 másodperces jelenetet rekonstruálni lehessen, 60 képkockányi információt kell kiolvasni az ember agyából. Ez igen komoly teljesítményt követel meg az fMRI-től.
Ezt a folyamatot segíti a kutatók által megalkotott MinD-Video nevű mesterséges intelligencia. Ez a Stable Diffusion nevű képalkotó modell módosított változata, amit úgy alakítottak át, hogy a bemeneti jeleket videóvá tudja konvertálni – írja az IFLScience.
Az eredményeket ezután az alapján értékelték, hogy mennyire értette meg az MI a látottakat – például tudja-e, hogy az ember eredetileg egy futó embert vagy egy futó macskát látott –, valamint pixelekre lebontva vizsgálták meg a rekonstrukció pontosságát.
Bár utóbbi terén még láthatóan van hová fejlődni, a kutatók azt találták, hogy előbbi szempont alapján a technológia 85 százalékos pontossággal dolgozik, ami 45 százalékkal jobb bármelyik, eddig megalkotott technológiához képest.
Bár az eredmény a tudósok szerint igen biztató, sok munka vár még rájuk, hogy egy látott jelenetet pontosan tudjanak rekonstruálni. Emellett hangsúlyozzák, hogy a technológia használatát fontos lesz szabályozni, hogy később ne lehessen visszaélni vele.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.
(Nyitóképünk képernyőkép. Forrás: Zijiao Chen / Jiaxin Qing / Juan Helen Zhou / Mind-Video)