Egy friss tanulmány arra figyelmeztet, hogy még a mesterséges intelligencia fejlett modelljei is hajlamosak furcsaságokra, például térdröntgenből következtetni a páciens sörivási szokásaira.
Egyre több hír jelenik meg arról, mennyire rátermett a mesterséges intelligencia, például, ha az orvosi képalkotás területén kell bizonyítania. És valóban, olyan dolgokat is észrevesz például a röntgenfelvételeken, amelyek már elkerülik az emberek szemét. A Dartmouth Health kutatóinak új tanulmánya azonban rámutat a mesterséges intelligencia effajta használatának rejtett kihívásaira.
A szakemberek 25 ezer térdröntgen-felvétel átvizsgálásával bizonyították, hogy az MI-modellek képesek „megjósolni” nem összefüggő és valószínűtlen jellemzőket. A mélytanulási algoritmusok egyik legnépszerűbb típusát, konvolúciós neurális hálózatokat (CNN-eket) képeztek ki egy bizarr feladatot végrehajtására: pusztán a térdröntgen-felvétele alapján jósolják meg, hogy a páciens eszik-e a sült babot vagy iszik-e sört. A modell ezt meg is tette: 63 százalékos pontosságot ért el a bab és 73 százalékos pontosságot a sör esetében.
Mindez meglepő, hiszen nincs kapcsolat a térd anatómiája és az étrendi preferenciák között, a modellek statisztikailag mégis szignifikáns eredményekre jutottak, mutatva, hogy képesek kihasználni az adatok nem összefüggő mintáit. Ezzel a „shortcut learningnek” (lerövidített tanulásnak) nevezett jelenség iskolapéldáját adták. A shortcut learning során az MI-modell megtanul egy feladatot megoldani az adatokban jelenlévő hamis összefüggések alapján, eltérően a feladattal közvetlenül összefüggő jellemzőktől. Ilyen tanulás akkor következik be, amikor az MI-modellek az adatok felületes mintáit használják ki, ahelyett, hogy értelmes kapcsolatokat tanulnának. Az orvosi képalkotásban ez azt jelenti, hogy a modell nem ismeri fel az egészségügyi állapotokat, hanem irreleváns nyomokhoz ragaszkodik.
„Ezek a modellek olyan mintákat látnak, amelyeket az emberek nem képesek, de nem minden általuk azonosított minta értelmes vagy megbízható. Kulcsfontosságú, hogy felismerjük ezeket a kockázatokat a félrevezető következtetések elkerülése és a tudományos integritás biztosítása érdekében” – figyelmeztet Peter L. Schilling, ortopéd sebész, a tanulmány vezető szerzője. Brandon G. Hill társszerző pedig azt húzza alá, hogy az algoritmus képes megjósolni akár a röntgenfelvétel évét is, ami káros. Ha viszont a programozó megakadályozza, hogy megtanulja az egyik elemet, akkor ehelyett megtanul egy másikat, amelyet korábban figyelmen kívül hagyott. Ez a veszély nagyon fura állításokhoz vezethet, és a kutatóknak tisztában kell lenniük azzal, hogy ez milyen könnyen megtörténik, ha ezt a technikát használják. Az irreleváns, de statisztikailag szignifikáns összefüggések feltárásával történő „csalás” képessége komoly kockázatot jelent az orvosi alkalmazások számára.
A ZME Science példát is említ. Képzeljen el egy mesterséges intelligenciát, amely egy betegség kimutatására van kiképezve a mellkasröntgen-felvételeken. Ha a mesterséges intelligencia megtanulja, hogy egy adott kórház címkézési stílusát a betegségek elterjedtségéhez társítsa, az előrejelzései megbízhatatlanok lesznek, ha más kórházak képeire alkalmazzák. Ez a fajta elfogultság téves diagnózisokhoz és hibás kutatási eredményekhez vezethet. Mindemellett alááshatja az MI által vezérelt felfedezések hitelességét is. A kutatókat és az orvosokat félrevezethetik azzal a gondolattal, hogy a mesterséges intelligencia úttörő orvosi felfedezést tett, holott valójában csupán egy értelmetlen mintát használt ki.
A shortcut learning kihívására nincs könnyű megoldás. A kutatók különféle módszereket javasoltak a torzítás csökkentésére, például az adatkészletek kiegyensúlyozását vagy a zavaró változók eltávolítását. Ez a tanulmány azonban azt mutatja, hogy ezek a megoldások gyakran elmaradnak. A shortcut learning több, egymásba fonódó tényezőt is magában foglalhat, ami megnehezíti az elkülönítést és az egyes tényezők helyesbítését.
A Dartmouth Health kutatói úgy gondolják, hogy a shortcut learning kockázata különösen aggodalomra ad okot az orvosi képalkotásban (pl. röntgen-, CT-vizsgálatok stb.), ahol a gépi tanulástól remélik a diagnózis, és így a kezelés minőségének és hatékonyságának javítását. Éppen ezért sokkal komolyabb ellenőrzésnek kell alávetni az MI-t, különösen orvosi környezetben.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.