Olcsóbb nyelvmodell alternatívákat kínál az OpenAI

2025. május 09. - ferenck

Az OpenAI 2024 végén vezette be az o1-et, az első megerősítéses tanulással gondolatláncok generálására gyakoroltatott, kereskedelmi célú nyelvmodellt. Néhány hónapon belül az Anthropic, a Google és a kínai DeepSeek szintén előállt saját következtetőmodellekkel. Az OpenAI ezt követően ígéretet tett általános rendeltetésű GPT sorozatmodelljei és az o-sorozat következtető modelljeinek integrálására, ami egyelőre nem történt meg.

A Sam Altman nevével fémjelzett nagyvállalat most öt új modellt vezetett be. Mindegyik elfogad szöveges és képi bemenetet, amelyekből szöveges kimenetet generál. Az általános rendeltetésű GPT-4.1, GPT-4.1 mini és GPT-4.1 nano csak API-n (alkalmazásprogramozói felület) keresztül, míg a másik kettő, a következtető o.3 és o.4-mini API-n és a ChatGPT Plus, Pro és Team, valamint hamarosan a ChatGPT Enterprise és Education felhasználói számára is elérhető lesz.

Ezzel egyidőben a februárban kutatási előzetesként bemutatott GPT-4.5 júliusi leállítását is bejelentették. A nagyléptékű kísérletből kiderült, hogy a paraméterszám és a gyakorlóadat-mennyiség további növelése ugyan folyamatos teljesítménynövekedést eredményez, de a tokenenkénti költség alapján a használat egyáltalán nem tűnt praktikusnak.

Az új modellek alacsonyabb áron nyújtanak szintén kiváló teljesítményt.

A 4.1 család a 4.5 és a 4o költséghatékony megfelelői. Maximum egymillió token input lehetséges velük, ami komoly különbség a 4.5 és a 4o 128 ezréhez képest. A 4.1 ára két és nyolc, a minié 0,40 és 1,60, a nanoé 0,10 és 0,40 dollár között variálódik (egymillió token inputonként). A teljesítmény mind a 4.1, mind a mini esetében szinte mindenben jobb a 4o-énál,

Az o3 és az o4-mini az o1 és az o3-mini frissített változatai. Input korlátaik 200 ezer token, alacsony, közepes és magas-módban dolgoznak fel a felhasználó által nem látott, változatos számú következtető tokeneket. Elődeikkel ellentétben arra finomhangolták őket, hogy eldöntsék, mikor és hogyan használják a webes keresést, kódgenerálást és megvalósítást, képeditálást. Az árak tíz és negyven, illetve 1,10 és 4,40 dollár között variálódnak (egymillió input/output tokenenként).

Első OpenAI következtető-modellekként a gondolatláncot képekre is tudják alkalmazni. Például feltöltünk egy diagramot interpretációs utasításokkal, a modell pedig gondolatlánccal dolgozza fel. Az o3 teljesítménye a legtöbb kategóriában a mai csúcsminőség, és az o4-mini is jó eredményeket ért el a teszteken.