tech

Aggasztóan olcsók és súlyos következményekkel járhatnak a gépi tanulási eszközök képzésére használt adatkészletek elleni támadások – figyelmeztetnek a mesterséges intelligenciával foglalkozó szakértők.

A mesterséges intelligencia mögött álló gépi eszközök „tudása” nem öröktől fogva adott, ezeket is tanítani kell, mint a gyerekeket, még ha nem is ugyanolyan módszerekkel. A mélytanulási modellek betanítására óriási adatkészleteket, képzési adatokat használnak, és akár ezek is lehetnek egy (vagy több) hackertámadás célpontjai.

PDP/Gerd Altmann

A Google, az ETH Zurich, az Nvidia és a Robust Intelligence kutatói bebizonyították, hogy lehetőség van ilyen támadásra, azaz adatmérgezésre. Az adatmérgező támadások olyan támadások, amelyek a gépi tanulási modellek betanításához használt adatokat célozzák.

A támadó különféleképpen módosíthatja ezeket az adatokat, például hamis adatok beszúrásával, meglévő adatok módosításával vagy adott adatpontok súlyozásának manipulálásával. Az adatmérgezéses támadások súlyosak lehetnek, különösen azoknál a szervezeteknél, amelyek nagymértékben támaszkodnak gépi tanulási algoritmusokra a kritikus üzleti döntések meghozatalakor. Például egy adatmérgezési támadás a pénzügyi szektorban pontatlan hitelkockázat-értékelésekhez vagy csalárd tranzakciókhoz vezethet. Az egészségügyi ágazatban egy adatmérgezési támadás téves diagnózist vagy helytelen orvosi kezelést eredményezhet.

A kutatók – írja a ZDNet – azt állítják, hogy az általuk kidolgozott technikákkal kis erőfeszítéssel és alacsony költséggel lehet(ne) megmérgezni a kiemelkedő mélytanulási adatkészletek 0,01 százalékát. Bár ez nem tűnik túl nagy adathalmaznak, azonban már a lehetőség fennállása is ijesztő.

Az egyik mód, hogy a támadók elérjék az adatmérgezési céljukat, a lejárt domainnevek vásárlása. A gyanútlan felhasználó nem is sejti, hogy már megmásított adatokat kap a weboldalon. A szakemberek egy másmilyen támadást is demonstráltak, amelynél a támadó ugyan nem tudja teljes mértékben felügyelni az adatkészletet, viszont azt pontosan meg tudja jósolni, hogy a webes erőforrás mikor lesz elérhető egy adatkészlet-pillanatfelvétel készítése céljából. Ekkor a támadó közvetlenül az információgyűjtés előtt mérgezheti meg az adatkészletet.

MI mit tud a HVG-ben? Akinek van ötlete a mesterséges intelligencia hasznosítására, 1 milliót is kereshet vele a HVG pályázatán
Mindenki a mesterséges intelligenciáról beszél - de kinek van ötlete arra, hogy miként lehet kiaknázni az új technológiában rejlő lehetőségeket? A HVG Kiadó innovációs ötletpályázatára magánszemélyek és vállalkozások is nevezhetnek.

A kutatók egy példát is említenek: a Wikipédia-adatkészletek nem az élő oldalra támaszkodnak, hanem egy adott pillanatban készült felvételre, ami azt jelenti, hogy a beavatkozást helyesen időzítő támadók rosszindulatúan szerkeszthetik az oldalt. A szakemberek 6,5 százalékos sikerarányt jósolnak, ami nem magas, viszont a Wikipédia-oldalak nagy száma és a gépi tanulási adatkészletek betanításának módja azt jelenti, hogy pontatlan információkat lehet betáplálni a gépi tanulási eszközökbe.

Egyelőre még egyetlen élő Wikipedia-oldalt sem szerkesztettek, azonban a kutatók már értesítették a lehetőségről, illetve a védekezés lehetséges eszközeiről a Wikipédiát. Azt is megjegyzik, hogy vizsgálati eredményeik közzétételének célja nem az, hogy segítséget adjanak a hackereknek, hanem hogy másokat is arra ösztönözzenek, hogy végezzék el saját kutatásaikat azzal kapcsolatban, hogy miként védhetik meg a gépi tanulási rendszereket a rosszindulatú támadásoktól.

Összességében azért elmondható, hogy az adatmérgezéses támadások elleni védekezés sokoldalú megközelítést igényel, amely technikai és eljárási intézkedéseket is magában foglal. Íme néhány lépés, amelyet a szervezetek megtehetnek az adatmérgezés elleni védelem érdekében:

Adatminőség-biztosítás: A szervezeteknek biztosítaniuk kell, hogy a gépi tanulási modellek betanításához használt adatok pontosak, teljesek és reprezentatívak legyenek a megoldandó problémára vonatkozóan.
Adatfigyelés és -auditálás: A szervezeteknek figyelemmel kell kísérniük és auditálniuk kell a gépi tanulási modellek betanításához használt adatokat az anomáliák vagy gyanús tevékenységek észlelésére.
Modellellenőrzés: A szervezeteknek rendszeresen ellenőrizniük kell a gépi tanulási modellek teljesítményét, hogy azok pontos eredményeket produkáljanak.
Fenyegetésintelligencia: A szervezeteknek naprakésznek kell lenniük a gépi tanulási ökoszisztéma legújabb fenyegetéseivel és sebezhetőségeivel kapcsolatban, hogy azonosítsák a potenciális adatmérgezési támadásokat.
Munkavállalói tudatosság: A szervezeteknek ki kell képezniük alkalmazottaikat az adatmérgezéses támadások kockázatairól és a megelőzésük érdekében megtehető lépésekről.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Pille, Puli, Pillanat: Mit adnak a magyarok az űrkutatásnak? Meg fog lepődni, mennyi mindent

Űrmérnök, űrpolitikus, űrpszichológus: kozmikus képzések is működnek már a magyar egyetemeken

Űrverseny vagy űrháború indul most? Szemünk előtt áll fel az új világegyetemrend

Műholdas földmegfigyelés: magyar vállalat is lehet globális adatszolgáltató

mesterséges intelligencia

A Microsoftnál már a gép írja a kód 30 százalékát, az is kiderült, miben a legjobb

Nagyot vállalhat az Apple az iPhone 17-modellekkel

Itt van, tölthető: megérkezett a Meta legújabb alkalmazása

Hirdetés

Címkék

Itt a legújabb veszély az interneten: az adatmérgezés

MI mit tud a HVG-ben? Akinek van ötlete a mesterséges intelligencia hasznosítására, 1 milliót is kereshet vele a HVG pályázatán

Pille, Puli, Pillanat: Mit adnak a magyarok az űrkutatásnak? Meg fog lepődni, mennyi mindent

Űrmérnök, űrpolitikus, űrpszichológus: kozmikus képzések is működnek már a magyar egyetemeken

Űrverseny vagy űrháború indul most? Szemünk előtt áll fel az új világegyetemrend

Műholdas földmegfigyelés: magyar vállalat is lehet globális adatszolgáltató

A Microsoftnál már a gép írja a kód 30 százalékát, az is kiderült, miben a legjobb

Nagyot vállalhat az Apple az iPhone 17-modellekkel

Itt van, tölthető: megérkezett a Meta legújabb alkalmazása

Pille, Puli, Pillanat: Mit adnak a magyarok az űrkutatásnak? Meg fog lepődni, mennyi mindent

Elfogták az uppsalai lövöldözés gyanúsítottját

Pár perc nevetés fél óra edzéssel ér föl – így vegyük rá magunkat egy kiadós hahotázásra

Távozik Trump nemzetbiztonsági tanácsadója, aki felvett a titkos csetre egy újságírót

Új szakasz kezdődhet az amerikai-ukrán kapcsolatokban az ásványkincsekről szóló alkuval

A közmédia riporterét hazaárulózták a Kossuth téren, Hadházy a Margitszigetre ment, a Momentum a Várba indult, de visszafordult

Magyar Péter: Orbán jól látja, az emberek a Tisza Párt révén avatkoznak majd be a választásokba

Elküldte, de nem fizette ki a dolgozókat a paksi atomerőművet építő egyik orosz cég

Napi ötszöri étkezés vs. időszakos böjt – ezt eszi egy átlagos napon a dietetikus és az élelmiszerbiológus

Kiesett a Veszprém a BL-ből, utolsó másodperces gól pecsételte meg a sorsát

Eddig nem ismert részleteket árult el a Gyárfás-Portik-hangfelvételekről a Fenyő-gyilkosság bírósági szakértője

Böllérfesztiválon mulatott, majd eltűnt a szexuális visszaélés gyanúja miatt leváltott pap