A közvéleményben az a kép él az általános mesterséges intelligenciáról (artificial general intelligence, AGI), hogy a számítógépek ugyanolyan intelligenssé válnak, mint az ember, és képesek lesznek elvégezni a legtöbb vagy az összes tudományos munkát.
A gépitanulás-szakértő Andrew Ng új tesztet – új Turing-tesztet – javasol a gépi intelligencia megítélésére.

„A tesztalany, legyen az számítógép vagy képzett szakember, hozzáférést kap egy internet-eléréssel és olyan szoftverekkel rendelkező számítógéphez, mint egy webböngésző és a Zoom. A bíró többnapos élményt tervez a tesztalany számára a számítógép közvetítésével a munkafeladatok elvégzéséhez. Például az élmény állhat képzési időszakból (mondjuk, hívásközpont-operátorként), amelyet a feladat elvégzésére (hívások fogadására) való felkérés követ, folyamatos visszajelzéssel. Ez tükrözi azt, amit egy teljesen működőképes számítógéppel (de webkamera nélkül) rendelkező távmunkástól elvárnának. Egy számítógép akkor teljesíti a Turing-AGI tesztet, ha a munkafeladatot ugyanolyan jól elvégzi, mint egy képzett ember” – írja Ng.
Sokak szerint egy valódi AGI átmenne a teszten, és ha tényleg annyira intelligens, mint mi, akkor ez így is lesz.
Új tesztre pedig azért van szükség, mert az AGI ma már inkább divatszó, semmint pontos jelentéssel rendelkező kifejezés. Racionális megközelítésben bármilyen ember által elvégzett szellemi munkát abszolváló MI, csakhogy a fejlesztésben érintett üzleti szereplők túl gyakran elmondják, hogy most már tényleg – fél, egy, két éven belül – jön az AGI, ám az ilyen kijelentésekkel a mérce automatikusan alacsonyabbra megy le.
A definícióbeli eltérések azért károsak, mert azt a benyomást keltik, hogy az MI erősebb, mint a valóságban. Mindenkit félrevezetnek, vállalatvezetők az egy-két évre prognosztizált „eljövetel”, a hype alapján feleslegesen fektethetnek be súlyos összegeket elvileg mindent, a valóságban sokkal kevesebbet megoldó technológiákba. Egy MI-nek nem a bírát kell megtévesztenie – márpedig az eddigi megmérettetéseknek ez volt a lényege –, hanem gazdaságilag hasznos tevékenységet, munkát kell végeznie. Ng tesztje pontosan az erre alkalmas mesterséges intelligenciákat azonosítaná.
A mostani legtöbb benchmark tesztsorát előre meghatározzák, a fejlesztők pedig a tesztsorokra finomhangolhatják modelljeiket. Ráadásul ezek a tesztek csak az intelligencia csekély részét vizsgálják. Az újban viszont a bíró szabad kezet kap, improvizálhat is, és értelemszerűen senkivel nem közli előzetesen, hogy miről is lesz szó.
Ilyen teszttel megelőzhetők a hype miatti túlzott elvárások, lufi kipukkadások, MI-telek. Realistább utat kövezne ki az AGI felé. És annak ellenére, hogy például esetleg az összes modell megbukna, ugyanezek a modellek hasznos alkalmazásokban ténykedhetnek. Ha pedig valamelyik átmenne rajta, akkor a valóságban, és nem fejlesztői prognózisokban jutnánk el az AGI-szintig.












