Hogyan lehet egy kínai MI az amerikai exporttilalmak ellenére világvezető?

2025. február 03. - ferenck

A DeepSeek kínai startup R1-e ugyanolyan jó, sőt, egyes feladatokban jobb következtető-érvelő modell, mint a világvezető ChatGPT o1 – derült ki friss teljesítménymérésekből. A cég ékesen szemlélteti, hogy a korlátozások (az MI-hez szükséges amerikai high-tech exporttilalma) hogyan fordíthatók innovációvá.

A Szilícium-völgyet, az egész globális MI-fejlesztő közösséget sokkolta a Donald Trump elnöki beiktatására időzített hír, és az amerikai Big Tech pánikmódra kapcsolt.

A DeepSeek R1 nevű modelljét az amerikai nagy nyelvmodellek (LLM-ek) töredékért fejlesztették, gyakoroltatták, működtetik. Ráadásul nyílt forrású, ingyenes, azaz demokratizál és egyenlősít, például a Globális Dél anyagiakban nem dúskáló fejlesztőinek is lehetővé teszi a használatot, innovációt.

R1 teljesítménye azt is jelzi, hogy a szigorítások nem úgy működnek, ahogy Washingtonban elképzelték. Annyit értek el velük, hogy a kínai startupok a hatékonyságot, az erőforrás-takarékosságot és az együttműködést előtérbe helyezve, újítani kezdtek.

A különösen matematikában ás kódolásban kiváló modell létrehozásához a DeepSeeknek át kellett dolgoznia a gyakoroltatási folyamatot, hogy csökkentse az Nvidia csúcsmodelljeinél jóval kevesebbet, feleannyit teljesítő grafikus processzoraira (GPU-ira) nehezedő nyomást.

A mérnökileg egyszerű R1 a ChatGPT o1-hez hasonlóan, problémákat lépésről lépésre, a lépéseket azonban nem akkurátusan részletezve, érvelve, „gondolatlánccal” (Chain-of-Thought, CoT) oldja meg.

A DeepSeek hat kisebb, laptopokon is futó változatot is közzétett. A hírverés ellenére viszonylag keveset tudunk a 2023-ban, Hangcsouban alapított startupról. Alapítója Liang Wenfeng informatikus, villamosmérnök, az ő célja is általános mesterséges intelligencia, AGI építése.

A kínai MI-terepet olyan techóriások, mint az Alibaba és a ByteDance, valamint bőkezű befektetők által támogatott, nem túl sok startup uralja. Kis- és középvállalkozásoknak kifejezetten nehéz betörniük, versenyezniük. Ritkák az anyagi támogatóköröket nem tervező cégek, mint a DeepSeek.

2024 nyarán Liang elmondta egy interjúban, hogy a chiptilalom mellett a helyi MI-mérnöki technikák is problémásak, mert nem elég hatékonyak és sokat fogyasztanak. Cége mindenesetre megtalálta a megoldást, a hardveres kihívást innovációvá változtatták.

A fiatal kínai fejlesztők új generációja egyértelműen nyílt forráskódban és együttműködésben gondolkozik. Ezzel is kompenzálják az amerikai tiltásokat.