Fenyegetheti-e egy kicsi chipgyártó cég az Nvidia grafikus feldolgozóegységeivel (GPU) megszerzett kvázi monopóliumát a mesterséges intelligenciát működtető hardver felett?
A kaliforniai GSI Technology az MI-feldolgozás új megközelítését, a számítások közvetlenül a memórián belüli elvégzését képviseli. Asszociatív feldolgozó egységükre (associative processing unit, APU) a Cornell Egyetem tanulmánya hívja fel a figyelmet: célja a régóta fennálló teljesítmény- és hatékonyságkorlátok leküzdése, megkérdőjelezve az MI-kben és az adatközpontokban használt legjobb GPU-k dominanciáját.

A Cornell kutatói a GSI Gemini-I APU-t összehasonlították a piacvezető CPU-kkal (központi feldolgozóegység) és GPU-kkal, köztük az Nvidia A6000-ével. A teszteken realisztikus következtetési-érvelési feltételeket biztosító, tíz és kétszáz GB közötti adatkészletekkel dolgoztak. Kiderült, hogy statikus RAM-ban végzett számításokkal csökkent a processzor és a memória közötti folyamatos adatkeverés, a hagyományos GPU-architektúrák energiaveszteségének és a késleltetésnek az egyik forrása. Az eredmények alapján az APU sokkal kevesebb energiafogyasztással ért el GPU-szintű átviteli sebességet.
A különbség egészen drasztikus, ami nagyon bíztató az MI brutális környezeti széndioxid-lábnyoma miatt: az APU esetenként 98 százalékkal kevesebb energiát fogyasztott, mint egy hagyományos GPU, és a hasonló CPU-knál akár 80 százalékkal gyorsabban végezte el a lekérdezési feladatokat.
Ez a hatékonyság vonzóvá teheti a peremhálózati eszközök, például drónok, IoT-rendszerek és a robotika, valamint a szigorú energia- és hűtési korlátokkal dolgozó védelmi és repülőgépipari felhasználás számára.
A bíztató eredmények ellenére nem világos még, hogy a „számítások a memóriában” alapú számítástudomány eljuthat-e az érettség és a támogatottság, vagy a méretezhetőség ugyanazon szintjére, mint a fontos MI-eszközök zökkenőmentes integrációját garantáló, jól kidolgozott szoftver-ökoszisztémával rendelkező legjobb GPU-platformok.
A „számítások a memóriában” eszközöknél az optimalizálás és a programozás a szélesebb körű elterjedést, különösen a nagy adatközpontokban történő használatot lassító, hátráltató kifejlődő fázisban van még csak.
A GSI Technology a Gemini-II generációval igyekszik tökéletesíteni a hardvert: tízszer nagyobb átviteli sebességet és alacsonyabb késleltetést várnak tőle. Egy másik tervük, a fejlesztési stádiumban lévő Plato beágyazott peremszámítási (edge computing) eszközök számítási teljesítményét hivatott növelni.
Ha az APU sikeres lesz, komoly diszruptív hatást fejthet ki a százmilliárd dolláros MI következtetés-érvelés piacra és az Nvidia-uralmat is veszélyeztetheti (hacsak az Nvidia nem vásárolja fel a startupot). Az energiaköltségek – és a környezetszennyezés –a memóriaközpontú architektúra miatt a mostaniak töredékére csökkenhetnek, és a Gemini-II tovább javítja a helyzetet.
