Hol tartanak ma a mesterségesintelligencia-fejlesztések? – Will Douglas Heaven az MIT Technology Review senior MI-szerkesztője a neves szaklap július huszonegyedikei The Algorithm hírlevelében igyekezett megválaszolni a kérdést. Öt pontban foglalta össze a 2025. nyári helyzetet.
„A generatív MI annyira jó lett mostanra, hogy az már ijesztő” – állítja az első pontban. Nemrég tíz zenét osztott meg az újság szerkesztőgárdájával, és ki kellett találniuk, melyik MI, melyik ember munkája. Pocsékul tippeltek. A zenéhez hasonlóan, a médiában, a kódolásban, a fehérjeszintézisben, a képalkotásban (lásd az alábbi ábrát), a videóban és sok más területen hasonló gyors fejlődés megy végbe. Az MI-t egyaránt tarthatjuk a legjobb vagy a legrosszabb dolognak, viszont ne becsüljük alá: jó és egyre jobb lesz.
„A hallucináció tulajdonság, nem hiba” – hangzik a második pont. Ha az MI kitalál valamit, hallucinációról beszélünk: ügyfélszolgálati botok nonszensz visszatérítéseket ígérnek, jogászok appjai nemlétező esetekkel teli jelentéseket készítenek és hasonlók. Minél közelebbről tanulmányozzuk a generatív MI-t, annál inkább rájövünk: pontosan ezt teszi mindig – hallucinál. Eleve azért fejlesztik mindet, hogy kitaláljanak dolgokat. Nem a nonszensz-fabrikálás a lényeg, hanem, hogy a nonszenszek kapcsolódnak a valósághoz. Tehát jobb, ha fejben tartjuk: mire képes, mire nem a modell, és ne reménykedjünk hallucináció nélküli jövőben.
Három: „az MI energiaéhes, és még éhesebb lesz.” A modellek masszív fogyasztása közismert, csakhogy az elképesztő számok a gigászi LLM-ek trenírozásához köthetők. Egyrészt, ritkán gyakoroltatnak ekkorákat, másrészt viszont százmilliók használják őket napi szinten (a ChatGPT-t heti 400 millióan). A használat ugyan kevésbé energiaigényes, mint a gyakoroltatás, de sok kicsi sokra megy… Közben új adatközpontok épülnek sivatagokban, a szolgáltatók átalakítják az energiahálózatot. A cégek alig osztanak meg fogyasztási infókat, így a tényleges számokat illetően a sötétben tapogatózunk. Az egyre több nyílt forrású modell hozhat változást.
„Senki nem tudja pontosan, hogyan működnek az LLM-ek” – állítja Heaven a negyedik pontban. Tisztában vagyunk fejlesztésük és működtetésük mikéntjével, az input és az output között történtekkel viszont nem. Soha nem láttunk még ennyire alig értett, milliárdok által használt tömegpiaci technológiát. Amíg nem ismerjük jobban az MI-t, nem tudhatjuk pontosan, hogy mire képes, mire nem, viselkedését teljesen nem kontrollálhatjuk – és a hallucinációit is maximum csak kapisgáljuk.
„Az AGI nem jelent semmit” – legalábbis az ötödik pont alapján. Az általános mesterséges intelligencia (AGI) témája nem is olyan régen marginális volt, ma viszont komoly kutatók állítják, hogy azt fejlesztenek, jelentsen bármit is. De hogyan állapíthatjuk meg, hogy kognitív feladatok széles spektrumában elérte az emberi teljesítményt? Melyik emberét, miként mérjük, mekkora a feladat-skála, mi az intelligencia? Ha valaki AGI-ról beszél, a mainál jobb technológiát ért rajta. Feltétlenül hiszünk az MI fejlődésében, viszont semmi bizonyítékunk nincs arra, hogy a jövőben is fejlődni fog. Jelenleg az embert egyes dolgokban bámulatosan jól utánzó gépek építésénél tartunk, a technológiának viszont komoly hibái is vannak még, és a működését is csak próbáljuk kitalálni. Úgy fejlesztjük őket, hogy emberi elmét képzelünk mögéjük. Ez az elképzelés vezet az MI képességeivel kapcsolatos túlzásokhoz, és komoly szerepet játszik a technooptimisták és a technoszkeptikusok közötti tágabb kultúrharcban is.