A Google-nél állítólag tudtak arról, hogy az OpenAI a YouTube-videók szöveges átiratát használja a saját mesterséges intelligenciája betanítására, de nem szóltak, mert a vállalat is ugyanezt teszi.
A YouTube vezérigazgatója, Neal Mohan nemrég interjút adott a Bloombergnek, és beleállt azokba, akik YouTube-videókkal tanítgatják a mesterséges intelligenciát. Az üzenetet elsősorban az OpenAI-nak címezte: a cég az új videókészítő mesterséges intelligenciáját, a Sorát trenírozta a platformon található tartalmakkal, így mutatva meg, milyen a való világ.
A témával kapcsolatban most a The New York Times közölt újabb részleteket, melyek szerint Mohanéknek a saját házuk táján is lenne mit söprögetni. A vállalat belső működését jól ismerő, nevük elhallgatását kérő források szerint az OpenAI és a Google is a YouTube-videókból generált leirattal képezte ki a saját mesterséges intelligenciáját. Ezzel megsérthették a YouTube felhasználási feltételeit, a tartalomgyártók jogait.
A lap szerint az OpenAI a Whisper beszédfelismerő eszközzel írt át szöveges formátumra több mint egymillió órányi YouTube-videót, az így kapott szövegeket pedig a GPT-4 betanítására használta fel. A The Information korábban szintén arról írt, hogy az OpenAI a YouTube-ból kinyerhető adatokat használja.
Matt Bryant, a Google szóvivője a The New York Timesnak azt mondta, a tartalmak ilyen felhasználása tilos, a cég pedig nem tudott arról, hogy az OpenAI ezeken a tartalmakon képzi a rendszerét. Az amerikai napilag szerint ugyanakkor voltak olyanok a cégnél, akik pontosan tudták, mi történik, de nem szóltak róla, mert a Google is hasonlóan járt el a saját mesterséges intelligenciája tanításával. Bryant szerint ez valóban így van, csakhogy a cég kizárólag azon felhasználók videóit használta fel erre a célra, akik erre engedélyt adtak.
A lapnak nyilatkozó forrás arról is beszélt, hogy a Google 2023 júniusában módosította a felhasználási feltételeit, ami így lehetőséget adott a cégnek arra, hogy a Google szolgáltatásában a felhasználók által készített dokumentumokon és táblázatokon képeztesse ki az MI-t. Bryant szerint csak azoknak a felhasználóknak a dokumentumait használják fel erre a célra, akik részt vettek a Google kísérleti funkcióinak tesztelésében.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.