Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Saját chipet tervez az OpenAI

2025. február 21. - ferenck

Az OpenAI csökkenteni szeretné függőségét az Nvidia chipjeitől. A cél érdekében saját tervezésű chipeket szeretnének, és dolgoznak is már az első generáción.

A következő hónapokban fejezik be az első terveket, majd a kész anyagot elküldik a világvezető Taiwan Semiconductor Manufacturing Co-nak (TSMC). A két vállalat egyelőre nem kommentálta a sajtóhírt.

openai_8.jpg

A tömeges gyártást elvileg 2026-ban kezdhetik meg. Egy chip tipikus első változatának elkészítése több tízmillió dollárba kerül, a végtermék nagyjából hat hónappal később készül el. Ez a normális gyártási menet, és így is lesz, hacsak az OpenAI nem fizet szignifikánsan nagyobb összeget a tajvani gyártónak. Semmi garancia nincs arra, hogy rögtön az első változat működjön, és hiba esetén tovább tarthat a gyártás.

Az OpenAI-nál mindenesetre úgy látják, hogy egy ilyen, gyakorlás-központú chip erősíti a cég beszállítókkal szembeni pozícióját. Az első chip után, a vállalat egyre fejlettebb processzorokat kíván előállítani, amelyek aztán minden egyes iteráció után jobban teljesítenek.

Ha minden rendben megy, az OpenAI tömegesen gyárthatja a TSMC-vel közösen első házon belüli mesterségesintelligencia-chipjét, és még 2025-ben tesztelheti az Nvidia-technológia alternatíváját. Az a tény, hogy ebben az évben elküldik a tajvani gyártónak a tervet, egyértelműen jelzi: gyorsan haladnak.

Más technológiai nagyágyúk, például a Microsoft és a Meta évek óta próbálkoznak hasonlóval, de házon belül nem jutottak el az igényeiket kielégítő megoldásig. A DeepSeek sikere pedig felvetette a kérdést, hogy a jövőben esetleg kevesebb chippel is megvalósítható csúcskategóriás MI-modell. 

A Meta hatvan-, a Microsoft nyolcvanmilliárd dollárt tervez 2025-ben mesterségesintelligencia-infrastruktúrára költeni, míg az OpenAI részt vesz a Donald Trump által januárban bejelentett ötszázmilliárdos Stargate infrastruktúra-programban. Az emelkedő árak és az egyetlen beszállítótól (Nvidia) való függés házon belüli kísérletekhez vagy külső alternatívák kereséséhez vezet.

Ha sikerül megvalósítani, az OpenAI korlátozottan fogja használni a chipjét. Ha nagyobb lélegzetű fejlesztés a terv, akkor sok mérnököt kell még felvenniük hozzá.

Kártyavárként omolhat össze az univerzum

A kvantumvilágból félelmetes következtetések vonhatók le, bizonytalanságok sokasága szivároghat be a valóságról alkotott rendszerezett világképünkbe. Például, hogy a teljes univerzum hamis vákuumban vagy hamis stabilitás állapotában van, és stabilabb állapotba „omolhat össze.”

Egy, a kvantummechanikát, relativitáselméletet, szinte bármit a fizikából egyesítő kvantumelmélettel foglalkozó nemzetközi tudóscsoport szerint ez megtörténhet, és a Nature-ben publikáltak is egy tanulmányt róla. Szimulációt futtattak le, felvillantva, hogyan érhet drámai módon véget az általunk ismert világ.

univerzum.jpg

Az univerzum szerkezetét teljesen megváltoztató folyamatról beszélünk. Az alapvető állandók rövid idő alatt módosulhatnak, és a világ kártyavárként omolhat össze – magyarázza a tanulmányt Zlatko Papic, a Leeds Egyetem elméleti fizikusa.

A hamis vákuum-elmélet nem új, a kutatók szerint munkájuk viszont a jelenség mögötti mechanizmusok első nagyléptékű szimulációja. A hamis vákuumban lenni a kozmosz legalacsonyabb energiaállapotát jelenti. Ez a csak átmeneti, a jövőben még alacsonyabb vagy az alapra csökkenő vákuumenergia.

A jelenség több völggyel, de csak egy igazi legalsóbb állapottal rendelkező hullámvasúthoz hasonló. Ha ez igaz, akkor jelenleg az egyik völgyben, a metastabilitás állapotában vagyunk. Ez átmeneti állapot, bár kozmikus léptékben évmilliókig, sőt évmilliárdokig is eltarthat. A kvantummechanika lehetővé teszi, hogy az univerzum a legalacsonyabb energiájú állapotba vagy az „igazi” vákuumba jusson. A folyamat kataklizma-szerű globális eseményhez vezethet.

Az elmélet középpontjában buborékok, az „igazi” vákuum hamis vákuumban képződött régiói állnak. A tudósok feltételezése, hogy a buborékok kialakulása kozmikus vákuumbomlást vált ki. A buborékok kifinomult fizikáját nehéz volt feltárni. 5564 qubites, speciális kvantumgéppel szimulálták a kialakulásukat, a hamisból az igaz vákuumba átmenő rendszert, hogy milyen komplexek a buborékok interakciói. 

Legfontosabb felfedezésük az volt, hogy – összhangban az elmélettel –méretüket a térfogati energianövekedés és a felszíni energiaveszteség határozza meg. Papic szerint izgalmas, hogy az új eszközök asztali laboratóriumként használhatók az univerzum alapvető dinamikus folyamatainak megértéséhez.

A tanulmány eredményei ugyan túlságosan ezoterikusnak tűnhetnek, a kutatók szerint a buborék-interakciók megértése viszont sokat segíthet kvantumszámítógépes hibák kijavításában. mert az alapokat jelentő qubitek ugyanis közismerten instabilak.

Lemezlovasként alkalmaztak egy katonai robotot egy San Franciscói klubban

San Francisco és a Szilícium-völgy a technológiai elit földje, ezért a legfurább ottani projekteken sem lepődünk meg. Például azon sem, hogy a Temple éjszakai klubban mesterséges intelligenciával működő robot játszik lemezlovasként.

A DJ-ket nem szokták említeni az automatizáció által fenyegetett állások között. Munkájuk változatos, ismerniük kell a zenéket, de gépi szempontból még fontosabb, hogy kapcsolatot kell teremteniük a közönséggel, a szó szoros értelmében meg kell mozgatniuk őket. Azaz rendelkezniük kell az empátia kifejezetten emberi, gépileg nehezen (egyelőre nagyjából sehogy sem) utánozható készségével.

robot_dj0.jpg

A fekete Phantom robot a Foundation (Alapítvány) Robotic Lab startup fejlesztése. Katonai célokra tervezték, ő a cég első nyilvánosan szereplő robotja, a későbbiekben autókat gyártó, raktárakban ténykedő – és persze harci zónákban aktív – humanoidok követhetik.

Mike LeBlanc a nevével Isaac Asimov előtt tisztelgő startup társalapítója tizenhárom évet szolgált a haditengerészetnél, és elmondta, hogy ügyfeleik között autógyártók, raktári és logisztikai cégek szerepelnek, de az amerikai Védelmi Minisztérium is a listán van. Gépeiket egyelőre békés célokra, repülőgép-karbantartásra és távoli régiókban üzemanyag-feltöltésre használja a hadsereg.

robot_dj.jpg

A Boston Dynamics és öt másik vezető robotikai cég megállapodott, hogy robotjaikat soha nem használhatják fegyverként. LeBlanc pont fordítva látja, szerinte a humanoid robotok kulcsszerepet játszanak a jövő hadviselésében. Ezért fejlesztenek nagyobb, gyorsabb és erősebb gépeket.   

Phantom január 31-én, egy péntek éjszaka debütált lemezlovasként. A Tech GigaParty rendezvény a 21. század első huszonöt évét volt hivatott ünnepelni, illetve a rendezők igyekeztek a hátralévő hetvenötből is felvillantani valamit a Burning Man fesztiválra emlékeztető publikumnak. LeBlanc szerint a robot kulturális-diplomáciai küldetést teljesített a bulin. Technót és house-t játszott harminc percben, humán DJ-t követett. Hetekig tanították a mozdulatokra, a számok kiválasztásában emberek segítették előzetesen.

Sankaet Pathak a másik társalapító elmondta, hogy a DJ-szett a távoli múlttól a messzi jövőig mesélte el az ember történetét. A kísérő vizuális anyagot MI generálta.

Számítógépet használnak az ágensek

Az Anthropic, a Google, az OpenAI és más mesterségesintelligencia-fejlesztők számítógép-használatra alkalmas ágenseken dolgoznak. A kínai Tsinghua Egyetem és a szintén kínai ByteDance vállalat kutatói bemutatták, hogyan gyakoroltathatók az ágensek alapjául szolgáló modellek ehhez.

UI-TARS modelljük a Qwen2-VL kép-nyelvmodell finomhangolt változata érvelést használva dönt arról, hogyan klikkeljen az egérrel, a billentyűzeten mire nyomjon rá, és sajátítson el más cselekvéseket desktop gép és mobilalkalmazások használatához. A súlyok az Apache 2.0-án keresztül kereskedelmi és nem-kereskedelmi célokra egyaránt szabadon használhatók.

agens.jpg

A kutatók gondolatláncokkal (Chain-of-Thought, CoT) úgy bővítették a képernyőképekből és cselekvésekből álló gyakorló adatsort, hogy nem pontosított kép-nyelv modellt promptolva, az az aktuális cselekvéseket korábbi képernyőképek, cselekvések és generált CoT-k alapján magyarázta meg. Mivel a magyarázat időnként rossz volt, többféle CoT-t és cselekvést generáltak az adott képernyőképhez, majd kiválasztották a korrekt cselekvéshez vezető gondolatláncot.

A finomhangolt UI-TARS utasításból, képernyőképekből, CoT-kből és cselekvésekből CoT-t és cselekvést generált. Utána virtuális PC-n lefuttatták, kiszűrték a hibás CoT-ket és cselekvéseket, az outputokat pontozták, az alacsony pontszámúakat eltávolították, aztán a folyamatot és a finomhangolást megismételték. Humán résztvevők a CoT-ket és a cselekvéseket úgy korrigálták, hogy egyrészt elkerüljék a hibákat, másrészt, ha mégis van hiba, javítsák ki azokat.

Végül a modellt úgy optimalizálták, hogy az előző lépés hibás példáival szemben előnyben részesítse a javított példák generálását. Az UI-TARS következtetéshez kapott egy képernyőképet, egy utasítást és egy lehetséges műveletet, majd létrehozta a CoT-t és a végrehajtandó műveletet. Ezt követően új képernyőképet kapott, és megint generált hozzá gondolatláncot és cselekvést, és így tovább.

UI-TARS remek teszteredményeket ért el, például vagy ugyanúgy, vagy jobban teljesített, mint az Anthropic Claude 3.5 Sonnet csúcsmodelje. 

Fokozódik a verseny, olcsóbb csúcsmodell az OpenAI-tól

Az OpenAI közkinccsé tette az o1 modellek utódát, a gyorsabb, kevésbé drága, kódolásban, matematikában és tudományokban különösen jól teljesítő o3-minit. A nagy nyelvmodell (LLM) választható alacsony, közepes és magasszintű érvelési „erőfeszítést” kínál.

Mit jelent ez a valóságban? A szintek progresszíven több érvelési tokent kínálnak gondolatlánc (Chain-of-Thought, CoT) generálására, ami persze több időt és magasabb költséget is jelent. A modell a ChatGPT Plus, a Team és a Pro előfizetői számára, valamint az API (alkalmazásprogramozói felület) felhasználói körében érhető el. Regisztrált felhasználók az ingyenes ChatGPT szolgáltatáson keresztül, az „érvelés”-t választva tesztelhetik.

o3.jpg

Az o3-mini gyakorló adatkészletének összeállítói a tudományos és technológiai területen történő problémamegoldásra fektették a hangsúlyt, a modellt megerősítéses tanulással finomhangolták gondolatlánc-adatokon. Az o1 családhoz hasonlóan, díjat számít fel az érvelési műveletek során feldolgozott tokenekért, amelyeket elrejt a felhasználó elől. A rivális érvelő modellek, mint például a DeepSeek R-1, a Gemini 2.0 Flash Thinking és a QwQ-32B-Preview elérhetővé teszik ezeket a tokeneket.

Az o3-mini maximális inputja 200 ezer, maximális outputja százezer token, ismeretbázisát viszont 2023 októberével lezárták.

A felhasználók dicsérik a gyorsaságát, érvelését és kódolási képességeit. Megállapították, hogy a sok kontextusos, „tömbszerűbb” promptokra jobban reagál. Kisebb mérete miatt azonban nem rendelkezik a való világ átfogó ismeretével, és tények felidézésével is problémái vannak.

Nem sokkal az o3-mini közkinccsé tételét követően az OpenAI bemutatta a „mélykutató” ágenst (deep research), az o3-on alapuló ChatGPT kutatóágenst. Magát az o3 családot decemberben, a CoT-megközelítés újabb evolúciós állomásaként jelentették be. A mostani közkinccsé tétel kicsit úgy tűnik, mintha a kínai DeepSeek R-1-ére igyekeztek volna gyorsan reagálni, de az OpenAI hangsúlyozza: minden az ütemezés alapján megy. Egy biztos: tovább bővítették, finomították az o1 család érvelő-technológiáját, amellyel más fejlesztőknek is felállították az új mércét. Újabb alkalmazások várhatók, az MI egyre inkább szakmai partnerként, nem pedig intelligens gyakornokként fog működni.

Minél több felhasználó tanulja meg, hogyan promptoljon érvelő modelleket, annál jobb lesz az eredmény.

Kínai asztronauták mesterséges fotoszintézissel készítenek rakéta-üzemanyagot a világűrben

Kínai asztronauták elmondták, hogy a kelet-ázsiai szupernagyhatalom Tiangong űrállomásán, a Shenzhou-19 űrmisszió keretében, a „mesterséges fotoszintézis” nevű új eljárással rakéta-üzemanyagot – üzemanyag-összetevőket – készítettek, valamint oxigént és más fontos, hasznos űrbéli forrásokat is állítottak elő.

A széndioxidot és a vizet félvezető katalizátorokkal alakították oxigénné és etilénné. Ezt a szénhidrogént általában űrjárművek hajtóanyagainak előállításához használják.

kinai_urhajosok.jpg

A technológia zöld növények természetes fotoszintézisét utánozza fizikai és kémiai mérnöki módszerekkel. A széndioxid-forrásokat zárt terekben vagy földönkívüli légkörben oxigén és szénalapú üzemanyagok előállítására használják.

A kísérlet távlatosabb projekteket alapozhat meg. Olyan erőfeszítésekhez szolgálhat kiindulási pontként, hogy távoli helyeken lévő erőforrásokat a helyszínen alakítsanak át más forrásokká, például belélegezhető levegővé vagy az interplanetáris űrutazásokhoz szükséges rakéta-üzemanyaggá.

kinai_urhajosok0.jpg

A kínai asztronauták munkája egyben kritikus technikai támogatást is nyújt az ember űrbéli túléléséhez és a világűr további felfedezéséhez.

Félvezető katalizátorok használata eltér a hagyományos oxigén-előállító technikáktól, mint például a Nemzetközi Űrállomáson (ISS) alkalmazott elektrolízis, amellyel a napenergiát belélegezhető levegő forrásává alakítják át. Szakértők szerint az elektrolízis viszont túlzottan energiaigényes hosszútávú űrutazásokhoz.

Elektrolízis helyett a kínai kutatók kisebb energiahasználatot várnak a széndioxid mind szobahőmérsékleten, mind szabvány légköri nyomás alatti félvezető katalizátorokkal történő átalakításától. Részletekről egyelőre nem árultak el sokat, úgyhogy még nem tudni, mennyire és hogyan kivitelezhető, különös tekintettel az olyan távoli és barátságtalan környezetekre, mint például a Mars felszíne.

Ha viszont bebizonyosodik, hogy a módszer működik, a kínai űrkutatás komoly lendületet kap. 2035-ig a Hold déli sarkának környékén kívánnak bázist létesíteni, amelyhez állandó és belélegezhető, megbízható oxigénforrásra, az űrhajó visszaútján pedig üzemanyagra lesz szükségük.

Felpörög a megerősítéses tanulás

A DeepSeek R-1-e és a szintén remekül teljesítő Kimi k1.5 egyaránt megerősítéses tanulással generálja érvelését. Az OpenAI o1 körüli tavalyi munkák úttörőnek számítanak ezen a területen. 

Konklúzió? A megerősítéses tanulás több éves elbizonytalanodás után mégis az egyik legjárhatóbb út nagy nyelvmodellek (LLM-ek) fejlett érvelésének kidolgozásában.

megerositeses_tanulas.jpg

A technika lényege, hogy a modellt jutalmazza vagy bünteti adott cselekvés megvalósításáért, célok kivitelezéséért. A felügyelet melletti és a felügyelet nélküli tanulással ellentétben, az outputot nem hasonlítja össze ismert igazságokkal, explicit nem is mondja meg a modellnek, hogy milyennek kell lennie az outputnak. Helyette a random viselkedő modell a jutalom alapján jut el az óhajtott viselkedésig.

A megerősítéses tanulás például ezért nagyon népszerű játékos vagy robotirányító modelleknél. Ezeken a területeken nélkülözhetetlen is, LLM-ek fejlesztésénél viszont az emberi preferenciákhoz való igazodásra korlátozódott.

Emberek vagy az MI megítélésének megerősítése volt az elsődleges módszer, hogy az LLM-eket emberi preferenciákhoz való igazodásra ösztönözzék, A közvetlen preferencia-optimalizálást csak ezt követően dolgozták ki. 

Az újfajta LLM-ek esetében, az általuk generált gondolatláncot (Chain-of-Thought, CoT) javítandó, a megerősítéses tanulás pontos megoldásra bátorítja a modellt matematikai, kódolási, tudományos és minden olyan probléma esetében, amelyre létezik ismert megoldás. A tipikus LLM-gyakoroltatással ellentétben, amikor a modell outputjaiból a következő tokent generálja, és tokenenként kap visszajelzést, ezúttal a jó megoldáshoz vezető érvelő lépések szekvenciájáért kap jutalmat.

Még akkor is így tesz, ha közben, a prompt és a válasz között sok közbülső tokent kell generálnia. A megteendő következtető lépések explicit gyakorlása nélkül megtervezi a kimenetet, leellenőrzi a következtetést, értékeli a megközelítést. LLM-fejlesztők meg is lepődtek, mennyire hasznos ezen a területen a megerősítéses tanulás.

A technika nem egészen három éve túl bonyolultnak tűnt ahhoz, hogy megérje fáradozni vele. Most kulcsfontosságúvá vált.

Izgalmas és tanulságos a gépi tanulás fejlődéstörténete.    

Lekapcsolták a cyberbűnözés két legnagyobb piacterét

A német hatóságok által vezetett, az Europol, az amerikai Igazságügyi Minisztérium és az amerikai szövetségi bűnüldöző ügynökségek támogatását élvező nemzetközi akció felszámolta a két legnagyobb cyberbűnöző piacteret, a Cracked-et és a Nulled-et. A piactereken negatív figurák kereskedtek illegális javakkal, köztük hackelésre alkalmas eszközökkel.

A műveletben Németország és az USA mellett Ausztrália, Franciaország, Görögország, Olaszország, Románia és Spanyolország is részt vett.

cybercrime.jpg

Hét ingatlant kutattak át, tizenhét szervert és hatvanhét eszközt foglaltak le, több mint 300 ezer dollárnyi készpénzt és kriptovalutát koboztak el, két személyt vettek őrizetbe. Egyikük Spanyolországban élő argentin állampolgár, ő volt a Nulled egyik adminisztrátora.

A két fórum által tíz országban használt tizenkét fiókot és tíz domént, egy fizetési szolgáltatót és egy tárhelyet is leállítottak. Mindezek az illegális oldalakat támogató gazdasági hálózathoz tartoztak.

cybercrime0.jpg

Az Europol szerint a két piactérnek együtt több mint tízmillió felhasználója volt, cyberbűnözők „egyablakos ügyintézési pontként” használták illegális javak és „cyberbűn, mint szolgáltatás” (cybercrime-as-a-service, CaaS) termékek, például lopott adatok, malware-ek és hackeléshez használt programok beszerzéséhez.

Az USA Igazságügyi Minisztériuma közölte, hogy a Cracked 2018 márciusa óta értékesített lopott bejelentkezési adatokat, hacker-eszközöket és szolgáltatásokat malware-ek és lopott adatok tárolására. Több mint négymillió felhasználója volt, a termékeket huszonnyolc millió posztban reklámozták.

Szövetségi ügyészek szerint az oldal több mint négymillió dollárt keresett, és tevékenysége miatt minimum tizenhétmillióan váltak áldozattá csak az Egyesült Államokban.

A Nulled 2016 óta kínált hasonló termékeket több mint ötmillió felhasználójának, negyvenhárom milliónál több hirdetett posztban. Évi bevétele meghaladta az egymillió dollárt.    

Izmosabb mesterségesintelligencia-politikát hirdet az új amerikai vezetés

Donald Trump alatt az Egyesült Államok egyértelműen meg akarja szilárdítani vezető szerepát a mesterségesintelligencia-fejlesztésekben. A célt többek között a korlátozások csökkentésével kívánják elérni.

Az elnök 180 napos határidőt tűzött ki az MI cselekvési tervének elkészítésére, és erről szóló végrehajtási tervet írt alá. Az USA MI-hegemóniájának alapjait, a nemzetbiztonságot, a gazdasági versenyképességet akarja növelni vele.

usa_ai_politika.jpg

A rendelet az MI cselekvési terv kidolgozásának felelősségét az adminisztráció három kulcsfigurájára ruházza: Michael Kratsiosra, az elnök tudományos-technológiai asszisztensére (a Scale AI korábbi ügyvezető igazgatójára), az MI és a kriptovaluták új speciális tanácsadójára, David Sacks kockázatitőke-befektetőre, valamint Michael Waltz nemzetbiztonsági tanácsadóra. 

A cselekvési tervnek fenn kell tartania, erősítenie kell az USA globális MI-dominanciáját, és egyben fel kell függesztenie Joe Biden „ezzel elvileg ellentétes”, a fejlődés helyett hipotetikus veszélyeket hangsúlyozó 2023-as rendeletét.

Amerikai cégeknek ideológiai elfogultság nélkül, társadalmi céloktól mentesen kell MI-rendszereket fejleszteniük. A kormány meggyőződése, hogy a mostani rendszerekbe liberális politikai elfogultságot kódolnak. 

A rendelet a Szövetségi Menedzsment és Költségvetési Hivatalt arra utasítja, hogy az USA versenyképességével és nemzetbiztonságával összhangban álló MI-cégeknek ítéljen oda kormányzati szerződéseket. 

A legtöbb rendelkezés jelentős mérlegelési jogkört hagy a cselekvési tervet kidolgozó csapatnak, így azok értelmezését és végrehajtását nyílt végűvé teszik.

A rendelettel párhuzamosan az elnök bejelentette az OpenAI-t, az Oracle-t és a SoftBank-et magába foglaló Stargate vegyesvállalatot.

A három vállalat tervet vázolt fel, hogy százmilliárd dollárt fektetnek be az MI számítási infrastruktúrájába, például következőgenerációs adatközpontokba, majd 500 milliárd dollárt további négy év alatt ruháznak be. Ezen kívül az adminisztráció nemzeti energia-vészhelyzetet hirdetett az Egyesült Államok energiaellátására vonatkozóan, és utasítást adott ki a hazai energiatermelés felgyorsítására. Az intézkedések célja az olyan energiaigényes mesterségesintelligencia-kezdeményezések támogatása, mint a Stargate, azáltal, hogy felszámolják a szabályozási akadályokat az olaj-, gáz- és megújulóenergia-projektek szövetségi területeken történő kivitelezése előtt.

Milyen következményekkel jár az új kínai MI-modell berobbanása?

A kínai DeepSeek R1 mesterségesintelligencia-chatbotja alaposan felforgatja a területet. Teljesítménye eléri az OpenAI o1-ét, a modell nyílt forrású, szabadon hozzáférhető. Az amerikai tech nagyágyúk a tőzsdén rosszul reagálták le a kelet-ázsiai riválist.

Közvetlen következmények?  

deepseekr1.jpg

Egyrészt, Kína generatív MI-ben utolérte az USA-t, ami nyilván hatással lesz az MI ellátási láncra. Másrészt, a nyílt súlyú modellek árucikké teszik az alapmodell-réteget, komoly lehetőségeket teremtve alkalmazásfejlesztőknek. Harmadrészt, nem a méretnövelés az MI fejlődésének egyetlen útja. Annak ellenére, hogy a feldolgozó kapacitásra irányul a hype, az algoritmikus innovációk gyorsan csökkentik a gyakoroltatás költségeit.

A ChatGPT 2022. novemberi indulásakor az USA jelentős mértékben Kína előtt járt a generatív mesterségesintelligencia-fejlesztésekben. A különbség viszont jócskán és folyamatosan csökkent az utóbbi két évben. A kínai modellek megközelítik, egyes területeken, például videógenerálásban pedig meg is előzik már az amerikaiakat.

Andrew Ng gépitanulás-szakértő kiemeli az R-1-hez adott részletes technikai ismertetést, miközben több amerikai vállalat a nyílt forrást – az emberiségre leselkedő potenciális veszély miatt – elfojtó javaslatokkal bombázta a szabályozókat. Most egyértelművé vált, hogy a nyílt súlyok/nyílt forrás az MI ellátási lánc szerves része, és egy csomó cég használni is fogja. Ha az USA továbbra is stigmatizálja az open source törekvéseket, Kína leuralja a láncnak ezt a részét.

A nyílt súlyok már eddig jelentősen hozzájárultak az LLM tokenek áreséséhez, a DeepSeek modellje tovább erősíti a tendenciát. Az alapmodellek és az API-hozzáférés (alkalmazásprogramozói felület) nehéz vállalkozás, sokan máig nem tudják, hogyan tegyék rentábilissá modelljeik irdatlanul költséges gyakoroltatását, csökkentsék a fejlesztési kiadásokat. Az R-1 ösztönzőleg hathat, hogy nemcsak az amerikai MI-vállalatok útja járható, hanem olcsóbban is létrehozhatók csúcsmodellek, alkalmazások serege építhető rájuk.

Az R-1 azt is szépen szemlélteti, hogy az MI-fejlődésnek nem a méretnövelés az egyetlen útja. Hiába ölnek bele dollármilliárdokat, hiába igyekeznek egyesek elhitetni, hogy előrelépés csak így várható, a valóság sokkal árnyaltabb, a cél többféle megközelítéssel elérhető. Az amerikai embargó miatt a DeepSeeknek optimalizálási módszereket kellett megújítania, hogy gyengébb GPU-kat futtatva érjen el a modell ugyanolyan teljesítményt, mint az o1.

A közeljövő kérdése, hogy ezzel tendenciózusan csökken-e gyakoroltatáshoz a számítási igény. Az intelligencia és a számítások iránti kereslet mindenesetre folyamatosan nő, plafon a csillagos ég, és annál jobb, annál többet használunk mindkettőből, ha minél olcsóbb.

A DeepSeek fejlődését sokan sokféleképpen magyarázzák. Geopolitikai hatásai még elemzés tárgya, a ráépülő alkalmazási lehetőségek is. A nyílt hozzáféréssel viszont olyanok előtt is adott a lehetőség, akik eddig csak álmodozhattak a drága modellek miatt.

süti beállítások módosítása