A DeepSeek R1 modelljét az Nvidia H100 segítségével képezték ki, az érvelési képességét azonban a Huawei saját fejlesztésű processzora támogatja.
Pár nap leforgása alatt alaposan felforgatta a mesterséges intelligencia piacát a kínai DeepSeek. A vállalat által készített nyílt forráskódú érvelő modell, az R1, amiről Marc Andreessen kockázatitőke-befektető úgy nyilatkozott: ez az egyik legelképesztőbb, leglenyűgözőbb áttörés, amit valaha látott. A fejlesztést nemrég mi magunk is teszteltük.
Az R1 nemcsak a képességei miatt különleges, hanem azért is, mert a DeepSeek fillérekből fejlesztette ki – legalábbis ahhoz képest, hogy az amerikai cégekben dollármilliárdokat öntöttek az ilyen modellek miatt. Ráadásul úgy, hogy a cég a korlátozások miatt nem fért hozzá az amerikai technológiához.
Emiatt fel is merült a kérdés, hogy ha nem amerikai fejlesztésű hardver szolgálja ki a kínai mesterséges intelligenciát, akkor vajon milyen.
A választ az X-re felkerült egyik bejegyzés adhatta meg – szúrta ki a GSMArena. A beszámoló szerint az R1 ugyan az Nvidia H100 segítségével lett betanítva, de a Huawei által fejlesztett Ascend 910C nevű chipet használja a következtetésekhez, ami a betanított modell használatával generál válaszokat.
Mivel az Ascend-chip nem foglalkozik a rendszer képzésével, így a GPU energiafelhasználása is alacsonyabb. A Huawei Central megjegyzi: a Huawei még 2024-ben jelentette be az Ascend 910C-t, de nem kapott különösebben nagy hírverést a dolog.
A lap megjegyzi: az Ascend 910C viszonylagos alacsonyabb teljesítménye korlátot jelent a rendszer képzésében. A Huawei ezt a 920C lapka megjelenésével szeretné orvosolni, ami az Nvidia Blackwell B200 lapkájával kíván versenyezni – vagyis azzal a chippel, amit az iparág a legszélesebb körben használ a mesterséges intelligencia működtetéséhez.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.