Több nagy technológiai vállalat sem kért – így pedig nem is kapott – engedélyt arra, hogy a YouTube-ra feltöltött videók átiratát felhasználhassa a mesterséges intelligencia képzéséhez.
A YouTube vezérigazgatója, Neal Mohan április elején nyilvánosan szólt be az OpenAI-nak, amiért a cég engedély nélkül használta arra a platformra feltöltött videókat, hogy a saját mesterséges intelligenciáját képezze ki vele. Az ügy azóta elcsitult, Mohan azonban hamarosan ismét felemelheti a hangját, és az sem kizárt, hogy jogi lépéseket tesz a vállalat.
A Proof News legfrissebb jelentése szerint a világ legnagyobb technolóigai vállalatai közül néhány egy olyan adathalmazon kezdte el képezni a mesterséges intelligenciáját, ami több mint 173 ezer YouTube-videó átiratát tartalmazza. Mindezt anélkül, hogy bárkitől is engedélyt kértek volna ehhez. Az EleutherAI nevű nonprofit cég által létrehozott adatkészlet több mint 48 ezer csatorna YouTube-videóinak átiratát tartalmazza, és más cégek mellett az Apple és az NVIDIA is ebből dolgozott.
Az ügy ismét rámutat arra: a cégek a tartalomgyártók megkérdezése és beleegyezése nélkül használják fel az általuk létrehozott tartalmat a mesterséges intelligencia trenírozására.
Az adatkészletben nincs kép és hang, ugyanakkor a videók szöveges átirata szerepel benne olyan videósoktól, mint Mr. Beast vagy Marques Brownlee, emellett a The New York Times, a BBC és az ABC News videóinak átiratát is beletették. Hogy pontosan mely csatornák kerültek bele, azt itt lehet kikeresni. Marques Brwonlee az X-en úgy reagált: a probléma adott, és még nagyon sokáig adott is lesz.
Apple has sourced data for their AI from several companies
— Marques Brownlee (@MKBHD) July 16, 2024
One of them scraped tons of data/transcripts from YouTube videos, including mine
Apple technically avoids “fault” here because they’re not the ones scraping
But this is going to be an evolving problem for a long time https://t.co/U93riaeSlY
A Google szóvivője ezzel kapcsolatban megismételten Mohan korábbi kijelentéseit, miszerint az adatok felhasználása megsérti a platform felhasználási feltételeit. Az érintett techcégek nem reagáltak a vádakra.
A YouTube a világ legnagyobb videótára, így nem csak az átiratok, hanem a hangok, videók és képek tekintetében is egy aranybánya, ami vonzó a mesterséges intelligencia képzéséhez. A legnagyobb probléma, hogy ehhez a családi videókat is felhasználják a cégek.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.