A legújabb tesztek szerint csak annyi hibát vét a beszéd felismerésekor a Microsoft fejlesztése, mint amennyit egy átlagos ember is vétene.
A mesterséges intelligencia korában rendkívül fontos tényező lesz, hogy milyen hatásfokkal működnek a beszédfelismerő rendszerek. A Microsoft ezen a téren most mérföldkőhöz érkezett: a kutatók közlése szerint sikerült emberi szintre emelni a beszédfelismerő rendszerük pontosságát.
Xuedong Huang, a projekt vezető kutatója egyenesen történelmi sikerről beszél, nem véletlenül. Az iparágban szabványnak tekintett Switchboard tesztje szerint a szoftver 5,9 százalékos hibahatárral tévesztette el a szavakat, ami nagyjából megegyezik az emberi tévesztés arányával. A szakemberek neurális nyelvi modellekkel közös csoportba rendezték az egymáshoz hasonló szavakat, hogy minél nagyobb legyen a hatékonyság. A Microsoft a közeljövőben a digitális asszisztensében, a Cortanaban is felhasználja majd, de magkapja az Xbox is.
Bár a technológia valóban óriási mérföldkövet jelent, van még mit csiszolni rajta. Például azt, hogy a szoftver nagy távolságokról is hasonló hatékonysággal működjön, vagy hogy akkor is pontos legyen, ha beszéd közben nagy a háttérzaj. A Cortanahoz hasonló programok számára pedig valódi kihívás, hogy ne csak meghallják a kimondott szavakat, de értelmezzék és reagálni is tudjanak rá.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.