Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Nagyon nehéz problémáknál is jól érvel az OpenAI új modellje

2025. július 04. - ferenck

Az OpenAI a mesterséges intelligenciával történő érvelés, következtetés határait feszegeti folyamatosan. Lépésről lépésre haladnak, eredményeik fokozatosak és egyre ígéretesebbek. Az o1-pro és az o3 után,  júniusban bemutatott o3-pro kiterjedt érvelése különösen többlépéses tudományos problémák megoldásán dolgozó fejlesztők számára lehet vonzó.

Komoly tudományos, matematikai és kódolási problémák megoldására találták ki, a magas ár és a lassúság viszont eltérítheti a felhasználókat a vállalat eddigi leghatékonyabb látás-nyelv következtetőmodelljétől.

openai_10.jpg

A szöveges és képi input felső korlátja 200 ezer token, az output szöveges, százezer token a limit. Ismeretbázisát 2024. június elsejével zárták le, webes keresésre is alkalmas. A ChatGPT Pro és Team felhasználói az OpenAI alkalmazásprogramozói felületen (API) érhetik el. Hamarosan Enterprise és Edu (vállalati és oktatás) userek szintén hozzáférhetnek. Input/outputonként egymillió tokennél húsz/nyolcvan dollár az ár.

Az OpenAI sem az architektúráról, sem a gyakorlóadatokról, sem a gyakorlómódszerről nem közölt részleteket.

Teszteken a vállalat o3 és o1-pro modelljénél is jobban teljesített. Nehéz főiskolai matekverseny problémáinak megoldásában 93 százalékot ért el, míg a másik kettő 90-et és 86-ot. Egyetemi végzős szintű tudományos kérdéseknél 85-öt (81-gyel és 79-cel szemben), és kódolásban is jobbnak bizonyult.

Kvalitatív teszteken a humán vizsgáztatók konzisztensen jobbnak találták a két vetélytársnál. Tudományos elemzésekhez kapcsolódó lekérdezésekben, írásban, számítógépes programozásban és adatelemzésben (64,9, 66,7, 62,7 és 64,3 százalékot teljesítve) egyaránt felülmúlta őket.

A modellről készült eddigi beszámolók pozitívak, a válaszadással eltöltött hosszú idő miatt viszont kritizálják. Általános vélemény, hogy „iszonyatosan jó matekban és logikában”, de „a leglassabb és a dolgokat leginkább túlgondoló modell.”

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr7518894796
süti beállítások módosítása