2005. július. 23. 10:48 hvg.hu Utolsó frissítés: 2005. július. 23. 11:00 Tech

Űrhajósokkal beszélget a NASA virtuális asszisztense

A robotokkal folytatott intelligens párbeszéd – a tudományos-fantasztikus irodalom klasszikus témája – hamarosan egy lépéssel közelebb kerül a valósághoz a nemzetközi űrállomás asztronautái számára.

Kim Farrell, Clarissa egyik fejlesztője az
ivóvíz minőségét vizsgálja a robot segítségével.
© NASA
A kaliforniai Szilícium-völgyben működő NASA Ames Research Center és a Xerox Corporation egy sokoldalú, hangvezérelt számítógépes rendszert mutatott be a Michigani Egyetemen (Ann Arbor), ahol az Association for Computational Linguists szövetség 25. éves találkozóját tartotta. A Clarissa nevű rendszert az asztronauták munkaterhelésének csökkentésére fejlesztették ki.

„Clarissa egy teljesen hangvezérelt virtuális űrasszisztens, segítségével az űrhajósok hatékonyabban használhatják kezüket és szemüket, és teljes figyelmüket a megoldandó feladatra összpontosíthatják, miközben beszédparancsokkal vezérelik a rendszert” – fejtette ki Beth Ann Hockey, az Ames kutatóközpontban dolgozó fejlesztői csapat projektvezetője.
 
A Clarissa felszabadítja az asztronauták kezét és reagál beszédparancsaikra; munka közben hangosan felolvassa nekik a folyamat lépéseit, segít számon tartani a már elvégzett lépéseket, valamint rugalmasan megadható, beszédaktivált riasztásokkal és időzítőkkel biztosítja, hogy semmiről se feledkezzenek el.

Az asztronautáknak manapság már mintegy 12 000 bonyolult műveletet kell elvégezniük a létfenntartó rendszerek működtetéséhez, az űrruhák megvizsgálásához, a tudományos kísérletek elvégzéséhez, az orvosi vizsgálatok végrehajtásához és más rutinfeladatok elvégzéséhez.

„Próbáljon csak meg elemezni egy vízmintát, miközben végignézi egy eljárás kézikönyvét a számítógép képernyőjén, és mindezt mikrogravitációs lebegés közben” – mondja Michael Fincke asztronauta, aki a nemzetközi űrállomáson eltöltött hat hónap után a közelmúltban tért vissza. „A Clarissa űrasszisztenst beszédparancsokkal irányíthatom, meghallgathatom az útmutató lépéseit, és közben a kezemmel elvégezhetek egy eljárást – ez akkora segítség, mint ha még egy csapattag lenne a fedélzeten”.

Mivel a rendszernek mindig készen kell állnia beszédparancsok fogadására, a virtuális asszisztens első változata megpróbált értelmezni minden kiejtett szót, még a csapat tagjainak egymás közötti beszélgetéseit is. Ennek eredményeként a Clarissa nehezen tudta megkülönböztetni a beszélgetéseket a neki adott parancsoktól.

A megoldás a problémára (Oldaltörés)

A NASA Ames Kutatóközpontjában dolgozó Manny Rayner, a Clarissát meg-valósító csapat vezetője 2004-ben megbeszélést folytatott a Xerox európai kutatóközpontjában tevékenykedő Jean-Michel Rendersszel az esetleges együttműködés-ről. Azt remélték, hogy a Xerox gépi tanulás, nyelvészet és szövegkategorizálás terén szerzett tapasztalata növelni fogja a rendszer pontosságát „mindent vevő mikrofon” üzemmódban.

 „A NASA azt akarta, hogy a rendszer bármikor készen álljon a segítségre anélkül, hogy külön aktiválási parancsokat kéne adni neki” – magyarázta Renders. „Ezért nem lehetett az egyszerűbb "Start Trek" megoldást választani, ahol az űrhajósok a rendszer megkérdezése vagy egy parancs kimondása előtt egy bizonyos szót mondanak, például azt, hogy »számítógép«”. Meg kellett oldanunk, hogy a rendszer jobban meg tudja különböztetni a parancsokat a beszélgetéstől.”

A Renders által a NASA beszédfelismerési problémájára kidolgozott techno-lógiával a Clarissa pontosabban tudja elemezni a beszédet. Felismeri a szavakat, a mondatokat és a szavak összefüggéseit, és reagálni tud a különböző módokon megfogalmazott parancsokra. A rendszer megvizsgálja a mondat összes szavát, figyelembe veszi az egyes szavak helyes felismerésének megbízhatóságát, és bonyolult gépi tanulási algoritmussal súlyozza a különböző pozitív és negatív információkat.

Ezáltal a rendszer sokkal jobban el tudja különíteni a neki szóló parancsokat a beszélgetésektől. Renders szerint a továbbfejlesztés eredményeként a rendszer hibaaránya a korábbihoz képest több mint 50%-kal javult.

A Clarissa jelenleg mintegy 75 különböző parancsot ért, amelyek 260 körüli szóból álló szókészlettel fogalmazhatók meg. A csapat azt tervezi, hogy a jövőben tovább fogja növelni a parancsok számát és a szókészletet.

„Vannak eléggé egyszerű parancsok, mások azonban eléggé bonyolultak” – magyarázta Hockey. „Többnyire olyan parancsok hangzanak el, mint "tovább" vagy "menj a 8. lépésre". Előfordul azonban, hogy ilyesmit kell mondani: "10 óra 25-ös riasztást kikapcsolni" vagy "visszakérdezéses ellenőrzés beállítása a 3-as – 14-es lépésekre".

„A Xeroxszal közösen végzett Clarissa-fejlesztés jól példázza, mennyi előnye van a kutató szervezetek közötti együttműködésnek” – tette hozzá Hockey.