Csak nyílt forráskódú, kutatási célokat szolgáló modelleket képeztek olyan adatkészletből az Apple-nél, melyben YouTube-videók átiratai is benne voltak.
A mesterséges intelligenciák (MI) képzése rendkívül adatigényes folyamat, és minél nagyobb adatkészleteken tudják elvégezni ezt a betanítást, annál jobb lehet az MI. Ekkora adathalmazoknál azonban rendre előkerül a szerzői jog kérdése, hogy mégis milyen formában szerzik be ezeket az adatokat.
A napokban egy jelentés azt állította, a világ legnagyobb technológiai vállalatai közül néhány egy olyan adathalmazon kezdte el képezni a mesterséges intelligenciáját, ami több mint 173 ezer YouTube-videó átiratát tartalmazza. Tették ezt engedély nélkül. Az EleutherAI nevű nonprofit cég által létrehozott adatkészlet több mint 48 ezer csatorna YouTube-videóinak átiratát tartalmazza, és más cégek mellett az Apple és az NVIDIA is ebből dolgozott.
Az Apple a nyílt forráskódú OpenELM-modelljeinél használta ezt az adatkészletet, melyeket még áprilisban adtak ki. A cég a 9to5Mac érdeklődésére azonban elmondta: az OpenELM egyetlen MI- vagy gépi tanulásra épülő funkciójuk mögött sem lát el feladatot. Így az iOS 18-ban és a többi, idén debütáló új operációs rendszerben induló Apple Intelligence sem támaszkodik az OpenELM-re, utóbbi ugyanis csak egy kutatási célokra létrehozott modell.
Ez azt jelenti, hogy az Apple eszközeiben hamarosan megjelenő funkciók mögött álló mesterséges intelligencia nem YouTube-videókból lett képezve. A 9to5Mac felidézi: a cég már korábban is állította, hogy az MI-modelljeit jogszerű forrásból származó adatokkal képezték ki.
Végezetül, az Apple azt is elárulta a portálnak, hogy nem készül majd újabb változat az OpenELM-ből.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.