Az Nvidia új modellje legyőzhette a GPT-4o-t

2024. november 08. - ferenck

Az Nvidia különösebb felhajtás nélkül új mesterségesintelligencia-modellt vezetett be a piacra október közepén. A nagyvállalat mérnökei szerint a Llama-3.1-Nemotron-70B-Instruct (ez a neve) az MI Chatbot Arénában felülmúlta a legmodernebb versenytársakat, például a GPT-4o-t (OpenAI) és Claude-3-at (Anthropic).

Az új MI a Meta nyílt forrású Llama-3.1-70B módosított verziója, a Nemotron az Nvidia végeredményhez való hozzájárulására utal. A Meta nyílt forrású alapjaira fejlesztők szabadon építkezhetnek. A GPU (grafikus feldolgozóegység) gyártásban világelső vállalat a népszerű modelleknél „segítőkészebbet” akart fejleszteni.

Speciálisan összegyűjtött adatsort, nagyon fejlett finomhangoló módszereket és saját csúcskategóriás MI-hardvert használtak a Meta-modellhez, hogy a bolygó „leginkább segítőkész” mesterséges intelligenciájává alakítsák. (Az nem derült ki, mit értenek a jelzőn.)

Egyelőre nincs teljesen egyértelmű módszer eldönteni, hogy melyik MI-modell a legjobb. Ez nem szobahőmérséklet mérése, nincs abszolút mérce megítélni a különféle mesterséges intelligenciák teljesítményét.

Az összehasonlító tesztelés működik legjobban: különböző modellek ugyanazokat a lekérdezéseket, feladatokat, kérdéseket és problémákat kapják megoldásra, majd összehasonlítják az eredményeket (valamilyen szempont persze mindig kimarad), elsősorban, hogy melyik hasznos, melyik kevésbé az – aminek megítélése szintén szubjektív.

A Nemotron esetében úgy tűnik, nagyon szűk volt a különbség, ami azért is érdekes, mert a Llama-3.1-70B nem tartozik a Meta nyílt forrású csúcsmodelljei közé, léteznek sokkal masszívabb változatok is, például a 405B.

A kapacitások összehasonlításaként: a GPT-4o becslések szerint egybilliónál több paraméterrel fejlesztették, azaz a hetvenmilliárd valóban nem számottevő paraméter.