Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Mennyire pontosan válaszolnak nagy nyelvmodellek professzionális szintű lekérdezésekre?

2024. május 08. - ferenck

Sok pénzügyi szakember és jogász dokumentumok feldolgozásától kamatlábak előrejelzéséig, változatos célokra használ nagy nyelvmodell-alkalmazásokat. Ezekben az esetekben azonban kitüntetett fontosságú az output felügyelete, mert a tévedések súlyos következményekkel járhatnak.

A mesterséges intelligencia tipikus viszonyítási alapjait (benchmark) az általános ismeretek és a kognitív képességek kiértékelésére találták ki. Sok fejlesztő viszont jobban szeretné valódi üzleti környezetben mérni a modell teljesítményét – olyan esetekben, amikor a speciális ismeretek fontos szerepet játszhatnak.

benchmark.jpg

A független modelltesztelő szolgáltatás, a Vals.AI a nagy nyelvmodellek (LLM) jövedelemadóval, vállalati pénzügyekkel és szerződésjoggal kapcsolatos feladatok végrehajtásában mutatott teljesítményét rangsoroló viszonyítási alapokat dolgozott ki, egy, már meglévő jogi benchmark fenntartásával. A GPT-4 (OpenAI) és a Claude 3 Opus (Anthropic) különösen jól teljesített.

A Vals.AI ranglistái összehasonlítják több népszerű LLM pontosságát, költségeit, gyorsaságát. Az oldalon az eredmények elemzését is megtaláljuk, adatkészleteik viszont nem nyilvánosak.

benchmark0.jpg

A vállalat független szakértőkkel közösen dolgozott ki válasz-feleletes és nyílt kérdéses feladatokat az adott területeken.

A szerződésjog (ContractLaw) kérdései mellett a modelleket szerződések bizonyos feltételek mellett érvényes részeinek lekérdezésére, szerkesztésére, kivonatolására utasítják, majd el kell döntenie, melyik részletek felelnek meg a jogi normáknak.

A CorpFin vállalati pénzügyekre vonatkozó kérdésekre adott feleletek pontosságát teszteli. Nyilvános kereskedelmi hitel-megállapodást ad be a modellnek, majd olyan kérdéseket tesz fel neki, amelyek megválaszolásához előbb információkat kell kinyernie a dokumentumból, utána pedig az infók alapján kell érvelnie.

A TaxEval adózásra vonatkozó promptokon teszteli a modell pontosságát. A kérdések felével az adóköteles jövedelem kiszámítását és hasonló készségeket vizsgál, másik fele olyan ismeretekkel foglalkozik, mint különféle könyvelési módszerek adókra gyakorolt hatása, adók alkalmazása változatos eszköztípusokra.

A Vals.AI a jogi érvelést kiértékelő nyílt benchmark LegalBench-en nyújtott teljesítményüket is nyomon követi.

Április 11-én tizenöt modell közül a GPT-4 és a Claude 3 Opus teljesített legjobban. Előbbi a CorpFin és a TaxEval kategóriákban (64,8 és 54,5 százalékos pontossággal), utóbbi a másik kettőben (a GPT-4-t éppen csak megelőzve, 74 és 77,7 százalékos pontossággal) diadalmaskodott. Háromban a kisebb Claude 3 Sonnet lett a harmadik, míg LegalBench kategóriában a Google Gemini Pro 1.0-ja végzett a dobogó harmadik fokán.          

Többmilliárd Intel- és AMD-processzor van veszélyben

A San Diegoi Kaliforniai Egyetem és más amerikai felsőoktatási intézmények, valamint ipari vállalatok kutatóiból álló csoport két új támadásfajtát azonosított. Célpontjuk a csúcs-processzorokban található feltételes elágazás-előrejelzők. A támadásokkal többmilliárd használatban lévő processzor veszélyeztethető, bizalmas adatok kerülhetnek nyilvánosságra velük.

Az elágazás-előrejelző digitális áramkör a számítógép architektúrában; megpróbálja kitalálni, hogy egy ág (például egy „ha-akkor-más” szerkezet) milyen irányban halad, mielőtt végleg ismertté válna. Rendeltetése az utasítás-áramlás javítása,

hacking.jpg

Jelen esetben az útvonal-történeti regiszter (Path History Register, PHR) nevű elágazás-előrejelzőt támadják. Mivel a PHR az elágazás-rendet és az elágazás-címeket egyaránt nyilvántartja, több információ és nagyobb pontossággal van kitéve hackereknek.

A kutatók sikeresen rögzítettek több tízezer ágból álló sorozatokat pontos sorrendben, és a módszerrel titkos képeket szivárogtattak ki feldolgozás közben a széles körben ismert libjpeg képkönyvtárból.

Kivételesen pontos, Spectre-típusú (a modern processzorok spekulatív végrehajtását kihasználó) mérgezéses támadást is azonosítottak. A támadó számára lehetővé válik a téves ágelőrejelzések bonyolult mintázatainak áldozatkódon belüli kivitelezése. A manipuláció nem tervezett kódútvonalak végrehajtására késztetheti az így bizalmas adatait véletlenül felfedő áldozatot.

Míg a korábbi támadások egyetlen ágat vagy egy ág első példányát irányíthatták félre, és mindezt többször hajtották végre, hogy sikerüljön, addig az újhoz olyan pontos a kivitelezés, hogy akár egy ág többezer alkalommal használt, 732. példánya is félreirányítható.

Az Intelt és az AMD-t értesítették a biztonsági felfedezésekről, és a két vállalat dolgozik a probléma megoldásán.

Mesterséges intelligencia a gyártásban

Az utóbbi másfél évben a generatív mesterséges intelligencia vált a legfontosabb infokom technológiává. A felhasználók száma napról napra nő, köztük egyre több gyártócég is alkalmazza, vezetőik optimisták. Az MIT (Massachusetts Institute of Technology) friss felméréséből kiderült, hogy az MI-fejlesztésekkel kapcsolatos ambíciók erősebbek a gyártószektorban, mint a többi ágazatok zömében.

A teljesen automatizált intelligens gyár integráns részét látják benne, növeli a termék- és folyamat-innovációt, csökkenti a gyártási ciklus időtartamát és a széndioxid-kibocsátást, hatékonyabbá tesz eszközöket és folyamatokat, eredményesebb lesz tőle a karbantartás és a biztonság – állítja sok gyártó.

mi_gyartas2.jpg

A felmérés készítői azt vizsgálták, hogy gyártók hogyan profitálnak MI esettanulmányokból. A szektor mesterséges intelligenciával valamilyen szinten dolgozó háromszáz képviselője vett részt benne.

64 százalékuk kutatásokat vagy kísérleteket végez vele, 35 százalék már a gyártásban hasznosítja. Sokan kijelentették, hogy a következő két évben szignifikáns mértékben növelni igyekeznek MI-kiadásaikat. Akik még nem alkalmazzák a gyártásban, fokozatosan vezetik be.

mi_gyartas0.jpg

Az MI méretezésének (skálázásának) a tehetség, a készségek és az adatok hiánya a legfőbb hátráltatói. Minél közelebb kerül a cég a gyártáshoz, annál markánsabbak ezek a problémák. A nem megfelelő adatminőség és szervezés szintén megnehezíti sikeres felhasználási esetek kidolgozását.

mi_gyartas1.jpg

A legnagyobb cégek költik a legtöbbet, és az ő elvárásaik is a legmagasabbak. A mérnöki és tervezői területen a vezetők 58, gyári folyamatoknál 43 százaléka szerint a következő két évben cégük több mint 10 százalékkal növeli MI-költéseit.

Az MI miatti óhajtott nyereségek gyártási funkciókként változnak. A terméktervezés, a beszélgető MI és a tartalomkészítés a leggyakoribb felhasználási esetek, de a tudásmenedzsment és a minőség-ellenőrzés szintén fontosak.

mi_gyartas2_1.jpg

Ha nincsenek megfelelő adatalapok, akadozhat a méretezés. A nem adekvát adatminőséget a megkérdezettek 57, a gyenge adatintegrációt 56, a rossz irányítást 47 százaléka említette, és csak minden ötödik megkérdezett rendelkezik meglévő MI-modellekben való használatra kész gyártóeszközökkel. Minél nagyobb a gyártó, annál problémásabbak a nem megfelelő adatok.

A méretezéshez a töredezettséget is kezelni kell. A gyártók többsége szerint az adatarchitektúra, az infrastruktúra és a folyamatok modernizálása nélkül nem megy az MI-alkalmazás. Az adatrendszerek mérnökök, tervezők és a gyár közötti interoperabilitásának javítása szintén kulcsfontosságú.

Közeleg a szövegből zenét készítő mesterséges intelligencia áttörése?

A korábbi szövegből zenét (text-to-music) generáló eszközöket viszonylag kötetlen formájú instrumentális kompozíciókra, és kevésbé dalokra, szerkesztett versekre, kórusokra, vokálokra tervezték.

Az áprilisban kiadott Stable Audio 2 maximum háromperces hangszeres számokat generál, jól megkülönböztethető nyitánnyal, középső résszel és befejezéssel. A felhasználó feltölthet audio track-eket, és a modellel módosíthat rajtuk.

hanggeneratorok.jpg

A szövegből képeket gyártó egy évvel ezelőtti modellekhez hasonlóan, a mostani szöveg-zene generátoroknál is nehezen irányítható az output. Alig reagálnak alapvető terminológiákra (tempó, harmónia stb.), és általános stílusokat kérnek, mint például az utóbbi ötven évben igencsak sok változáson átment, alstílusokban bővelkedő pop.

Hiteles dalokat előállító modellek megjelenésével eljöhet az audió MI-k „Midjourney pillanata”: a felhasználók széles köre jön rá, hogy a modell promptokra személyes igényeinek, ízlésének megfelelő muzsikát tud előállítani.

hanggeneratorok0.jpg

Az Udio webalapú generátora bevásárlóközponti háttérzenétől heavy metalig változatos stílusokban alkot. A 2023 végétől szolgáltató Sumo hasonló, nemrég frissítették a kínálatát.

Mindkettő promptokból teljes zenekaros anyagokat, promptonként kettőt generál, dalszövegekkel, énekkel, hangszer-szólókkal. A felhasználó létrehozhat vele szövegeket, sajátját is feltöltheti, letöltheti, megoszthatja másokkal az outputot.

A lejátszás és a lájkok száma alapján ranglisták készülnek róluk.

Az Udio regisztrált felhasználói maximum havi 1200 dalt generálhatnak ingyen. A szöveges utasítás mellett meg kell adniuk a stílust is. A rendszer automatikusan leírásokkal helyettesíti művészek neveit, és a kimenetek gyakran egy az egyben úgy hangzanak, mintha a kért zenészek munkái lennének.

A modell 33 másodperces hangszegmenseket generál, amelyeket meghosszabbíthatunk, remixelhetünk, módosíthatunk. A cég semmit nem árult el a mögöttes technológiáról.

A Sumo felhasználói napi tíz dalt generálhatnak ingyen. Megadjuk a promptot, mire a rendszer maximum kétperces anyaggal áll elő. Külön utasításokban specifikálhatjuk a szöveget, stílust, címet. Valódi művészek nevét tartalmazó promptból Sumo nem generál zenét, és a technológiáról sincs infónk.

Bajban van a Stability AI

A Stable Diffusion szövegből képet generáló mesterségesintelligencia-modell mögötti, London-székhelyű Stability AI húsz alkalmazottat bocsátott el egy nappal azt követően, hogy bejelentették: bővítik a zászlóshajónak számító modellhez való hozzáférést. Mindez az alapító-vezérigazgató Emad Mostaque márciusi távozása utáni többhetes belső feszültség közben történt.

A húsz alkalmazott a vállalat munkaerejének kb. tíz százalékát jelenti, tehát jelentős létszámcsökkentésről beszélhetünk.

stability_ai.jpg

A két ideiglenes vezérigazgató Shan Shan Wong és Christian LaForte elmondta: az elbocsátási hullám a költségek csökkentését, a befektetők és partnerek támogatásának megerősítését, az innovatív termékek további megjelenéséhez vezető fejlesztéseket célzó stratégiai terv része volt.

Arról nem nyilatkoztak, mely részlegeket „karcsúsították.” A leépítés nem meglepő az elmúlt hónapok eseménylavinája után. Az egykori vezérigazgató önkéntes távozását ugyanis több ismert kutatóé előzte meg. Mostaque a vezetőtanácsban betöltött szerepéről is lemondott. A decentralizált MI területén szeretné folytatni kutatásait – nyilatkozta.

Pedig a cég az egyik legismertebb képgeneráló termék mögött áll, a generatív MI-forradalom kezdetétől jelen voltak, az alapmodelleket fejlesztő vállalatok közül viszont ők az elsők, akik csökkentik munkaerejük létszámát. A Stable Diffusion új verziója mellett, a Stable Diffusion 3-hoz való hozzáférési kört bővítették, és egyben bejelentették a szöveget zenévé alakító Stable Audio új változatát is.

Eközben jogi eljárások is várnak rájuk. Az OpenAI-hoz hasonlóan, ellenük is szerzői joggal védett anyagok modelljeik tanítására való felhasználása a vád. A Getty Images már tavaly beadta a keresetet, az ügy most jut bírósági szakaszba.   

Generatív mesterséges intelligencia és az avatárok

Az avatárokat eredetileg virtuális világbeli alteregóinknak tervezték, mára viszont a közösségi médiától a virtuális valóságon keresztül a populáris kultúráig, szinte mindenhol megjelentek.

K-pop zenekarok koncerteznek a tagok digitális hasonmásával, vagy már hasonmások sincsenek, csak teljesen virtuális, MI által generált lánycsapatok, mint a szintén dél-koreai MAVE.

avatarok.jpg

A Meta MI Híresség Avatárok gyűjteményének virtuális karakterei valódi celebeket utánoznak, a felhasználók úgy folytathatnak interakciókat kedvenc sztárjaikkal, mint influenszerekkel a valóságban.

Az avatárok térhódítása egyértelműen jelzi a technológia rugalmasságát, és leginkább azt, hogy életünk mennyire fontos szereplőivé váltak. A digitális interakciók napi rutinná alakulásával, az avatárok személyeknek és márkáknak is új önkifejezési módokat kínálnak, újszerűen kapcsolódhatnak másokhoz a folyamatosan változó online közegben.

avatarok0.jpg

És ez csak a jéghegy csúcsa, mert az „avatarizáció” transzformatív lehetőségeit a VR, az AR, a mélytanulás és az MI további fejlődésével fogják csak igazán kihasználni. Az állandó technológiai innovációkkal a realizmus és funkcionalitás soha nem látott szintjét elérve, egyre elenyészőbb lesz a valóság és a virtuális világ közti különbség.

Márkáknak nemcsak megfigyelni kell a közeget, hanem proaktívan fel kell lépniük marketing és technológia metszéspontján, hogy az ügyfél élménye még elementárisabb legyen. Az avatárok tökéletesek erre a szerepre. Digitális személyek megjeleníthetik az adott márka identitását, hagyományos maszkotokhoz vagy szóvivőkhöz hasonlóan, a brand jelképévé válhatnak. A Wendy’s és a KFC például különféle, a Fortnite és az Instagram felhasználóira rezonáló személyiséget találtak ki avatárjaiknak.

avatarok1.jpg

A nagy változást az MI jelenti: avatárok úgy taníthatók, hogy minél jobban megjelenítsék a cég legfontosabb értékeit. Ezzel nemcsak az interakcióik hitelesebbek, hanem a brand változatos platformokon való megjelenítése is konzisztens. Maga a cég kezeli az integritása megőrzésében hatékonyan segítő avatárokat, tehát nem függenek külső influenszerektől, más – „közvetítő” – vállalatoktól.

Az avatárok érintkezési pontok a fogyasztóval, erősítik benne a márka iránti elkötelezettséget. A Nike a Robloxon futó Nikeland-je exkluzív digitális termékeket kínál avatárokkal, a Coca-Cola kínai metaverzum-kampányának részeként a felhasználók saját Coca-Cola avatárokat készíthetnek, virtuális tereket fedezhetnek fel velük, ahol vásárolhatnak, játszhatnak, hírességekkel találkozhatnak.

Az avatárokban rejlő lehetőségek azonban túlmutatnak a rövid taktikai kampányokon. A fogyasztó márka iránti hűségének őrzőivé válnak, és a generatív MI-nek hála 24/7-ben képesek konzisztens tartalommal megtölteni az interakciókat, tanulnak is belőlük. Ajánlásaik személyesebbek lesznek, karakterüket mindinkább az adott felhasználó preferenciáihoz igazítják.

Átírják a felhasználói élményt, a brand digitális arcaként interaktív érintkezési pontként funkcionálnak.

A márkaélmény kiterjesztésének hatékony eszközeként megjelennek a fizikai világban is, innovatív módon lépnek interakcióba az ügyfelekkel. Az Ikea dolgozott már virtuális influenszerrel boltjaiban, más avatárok divatheteken tűnnek fel.

Az MI és az adatelemzés avatárokba integrálásával egyre több hasonlóra számíthatunk.

Kisokos: hogyan adjunk utasításokat a mesterséges intelligenciának avagy mire vigyázzunk promptolás közben?

A generatív mesterséges intelligencia térhódításával, a különböző modellekkel közösen készülő munkáknál nagyon fontos, milyen utasításokat adunk nekik a kimenettel kapcsolatban. Nincsenek aranyszabályok, de már most komoly tanulságok vonhatók le a ChatGPT berobbanását követő közel másfél év tapasztalataiból.

Mi vagy ki az MI, minek szeretnénk látni: romantikus költőnek, marketin-szakértőnek, könyvvizsgálónak, absztrakt festészettel foglalkozó művészettörténésznek, elsőéves joghallgatónak, állatélelmezés-felelősnek? Kinek, milyen közönségnek megy az anyag? Jobb, ha a chat legelején pontosítjuk ezeket.

prompt_2.jpg

Tegyük láthatóvá az implicit dolgokat, mert az MI nem lélekbúvár, nincsenek telepatikus képességei, nem olvas a gondolatainkban, nem találja ki, mit akarunk közölni vele. Fejben kell tartanunk, és a legvilágosabban kell megfogalmaznunk a célunkat. Kezdjük a kért cselekvéssel („magyarázd el”), pontosítsuk a végső kimenet formáját, hosszúságát, korlátait, kontextusát. Minél homályosabban fogalmazunk, az output annál távolabb lesz a várttól.

A végeredmény megfelelő tónusa, stílusa ugyanolyan fontos, mint a tartalma, nem mindegy, hogy Botticelli vagy Basquiat stílusú kép kell, a szöveg lánglelkű poézis vagy tényszerű, számszerűsített termékleírás stb.

prompt0_2.jpg

Figyeljünk a helyesírásra, nyelvhelyességre, nyelvtanra, hanyagoljuk a közösségi médiában megszokott rövidítéseket, mert ha nem, készüljünk fel a csalódásra.

Ha csalódás az első eredmény, magyarázzuk el az MI-nek az okokat, a magyarázattal finomítsunk a prompton, Elsőre egyébként is nagyon ritkán kapjuk azt, amit vártunk, folyamatos kommunikációval, iterációkkal, pontosításokkal juthatunk csak el az ideális kimenetig.

Maradjunk mindig pozitívak, ne mondjuk neki, hogy „ne csináld ezt és azt!” Legalábbis az elején, mert később már lehetünk kritikusak, miközben számunkra kedvező alternatívákat sugallhatunk neki, mint például „ez a kép túl kaotikus, az élénkpirosnál jobb a mélybíbor.”

Fogadjuk el, hogy az MI-nek megvannak a maga korlátai, és a gyakorlóadatait emberek szedték össze, tehát részrehajlása, elfogultsága a fejlesztőknek tudható be. A végeredményt senki nem ellenőrzi, úgy is viszonyuljunk hozzá.

Ne adjunk meg neki személyes infókat se magunkról, se a hozzánk közelállókról. Ettől még nem lesz jobb a prompt, másrészt személyiségjogi és biztonsági okok miatt.

Újabb lépés a kvantuminternet felé

A kvantuminformáció megosztásának lehetősége kulcsjelentőségű elosztott számításokhoz és biztonságos kommunikációhoz használandó kvantumhálózatok fejlesztéséhez. Maga a kvantumszámítás olyan fontos probléma- és feladattípusokban segíthet majd, mint pénzügyi kockázatok optimalizálása, adatok visszafejtése, molekulák tervezése, anyagok tulajdonságainak tanulmányozása.

A fejlődést hátráltatja, hogy a kvantuminformáció elveszhet, ha nagy távolságra továbbítják. A korlát kiküszöbölésének egyik módja a hálózat kisebb szegmensekre osztása, és az összes szegmens megosztott kvantumállapottal történő összekapcsolása.

kvantum0_10.jpg

A megvalósításhoz a kvantuminformációt tároló és újból lekérését biztosító kvantummemória-eszközre van szükség. Ennek a szerkezetnek kommunikálnia kell egy, az elsősorban a kvantuminformáció létrehozását támogató másik eszközzel.

kvantum_15.jpg

Az Imperial College London, a Southampton Egyetem, a német Stuttgarti és Würzburgi Egyetem kutatói a világon elsőként hoztak létre ilyen rendszert: a két komponenst összekapcsolja, és szabályos optikai szálakat használ a kvantumadatok továbbításához.

A két kulcsfontosságú eszköz összekapcsolása döntő lépés kvantumhálózatok megvalósíthatósága felé – állítják a kutatók. Izgatottak, hogy elsőként nekik sikerült ezt demonstrálni.

Nagy távolságra lévő helyek, sőt kvantumszámítógépek csatlakozásának, összekapcsolásának lehetősége kritikus tényező a jövő kvantumhálózatai számára – fűzte hozzá Lukas Wagner (Stuttgarti Egyetem), a kutatási eredményeket ismertető, a Science Advances tudományos periodikában megjelent tanulmány társszerzője.  

Drónok figyelik az illegális halászatot a Nagy Korallzátonynál

Egyre nehezebb az illegális halászok élete az ausztráliai Queensland szövetségi állam partjainál, a Nagy Korallzátonynál. Az illetékes szervezet, a GBRMPA (Nagy Korallzátony Tengeri Park Hatóság) figyelő és személyeket azonosító új dróntechnológiával mindent megtesz ellenük. A déli félteke nyarán a drónt sikeresen tesztelték.

Az illegális halászok által kedvelt egyes szigeteket és zátonyokat kellett felügyelnie. A hatóságok jól tudják, hogy ezeken a területeken végzik tevékenységüket, és a drón össze is gyűjtött hasznos információkat a védett zöld zónában ténykedő halászhajókról.

korallzatony.jpg

A gép neve Aerosonde 4.7, azaz – új fegyverként szolgáló – légi szonda.

A sokkal a látótávolság felett működő, sötétben is repülő drón fényképes, videó- és radar-bizonyítékokat gyűjt. Nappali infravörös és ultrazoom objektíveket tartalmazó gimbal kamerával rendelkezik, a nagy magasságban történő mozgást érzékelő optikai, hő-, radar- és egyéb szenzorok kombinációjával.

korallzatony1.jpg

A drón menetsebessége maximum 120 km/h, akkumulátora tizennyolc óráig bírja egy töltéssel, szigetekről ugyanúgy útnak indítható, mint járőröző hajókról. A GBRMPA vezetősége elmondta, hogy az információgyűjtés stratégiái több mint egy évtizede szerepelnek programjaikban.

A szó szerint zavarosban halászók számára észrevétlen, felderíthetetlen drón megváltoztathatja tevékenységüket. Fogalmuk sincs, mikor örökíti meg őket az ember nélküli légi jármű. Ott ácsorognak, halásznak, miközben a bíróságon minőségi bizonyítéknak számító felvételek sokasága készül róluk.

A bűnözők viszonylag rövid idő alatt viszonylag nagy mennyiségű halat tudnak lehalászni a védett területen. A megfigyelést korábban kisebb drónok végezték. Alacsonyabban repültek, lassabbak voltak, akkumulátoruk nem bírta sokáig, az illegális halászok viszonylag könnyen észrevették őket. Még ma is használatban vannak, de a GBRMPA elismeri: megközelítőleg sem olyan hatékonyak, mint Aerosonde 4.7. Kevesebb bizonyítékot gyűjtöttek, most viszont a törvényszegők is elgondolkodhatnak, mert egyértelműen sokkal többet kockáztatnak.

A Queenslandi Tenger Gyümölcsei Ipari Szövetség szerint meg kell őrizni a természetvédelem és a halászat egyensúlyát. Az illegális halászat komoly veszélyt jelent a törékeny egyensúlyra – közölték.

A szűk mesterséges intelligencia után a kompetens MI jöhet, és csak aztán az általános MI

A mesterséges intelligencia (valószínűsíthető) fejlődését három szakaszban írtuk le eddig.

A jelenlegi rendszerek, a go-bajnokokat verő algoritmusoktól az önvezető járművekig, sőt, a generatív modellekig, a gyenge MI-ként is ismert szűk MI (narrow AI) kategóriába tartoznak (első kép). Részterületeken, speciális feladatokban egyre jobban teljesítenek, bámulatos eredményeket érnek el, gyakran az embert is felülmúlják. Nagyon mélyre ásnak, csakhogy ezek a területek, feladatok általában jól számszerűsíthetők, és minél szűkebbek, annál hatékonyabban dolgoznak a gépek. Az önvezető autó még nem tudja legyőzni a sakkvilágbajnokot. Szakbarbár.

kompetens_mi.jpg

A második fejlődési fázis, az emberrel minden területen azonos eredményre képes általános mesterséges intelligencia (artificial general intelligence, AGI). Ezek az MI-k egyik feladatról teljesen másra váltva sem nullázódnak le, ugyanazon a magas szinten abszolválják, a korábban tanultakat tudják alkalmazni az újakra, nem felejtenek, maguk mögött tudják a szűk MI-re jellemző katasztrofális felejtést.

A harmadik, a mesterséges szuperintelligencia vagy csak szuperintelligencia (superintelligence) az embert minden területen felülmúlja, és olyan szintre jut el, amit a Homo sapiens már nem fog fel, nem értjük a cselekedeteit. Ők a sci-fi irodalomból és filmekből ismert, hol segítőkész, hol mindent elpusztító, a világra szenvedést hozó gépek. Tőlük illik rettegni, és őket vizionálják bele jövőképükbe a súlyos korlátozásokat, vasszigorú szabályozást követelők.

Konszenzus van arról, hogy az AGI szuperintelligenciává válása gyorsabban fog megvalósulni, mint a szűk MI általános mesterséges intelligenciává alakulása. Időpontokról felesleges elmélkedni, mert ahány kutató, annyi dátum. Egyesek szerint néhány év, mások évtizedekről, megint mások 2100-ról vagy évszázadokról beszélnek, míg vannak szakemberek, akik szerint soha nem lesz AGI. (A problémát bonyolítandó, az intelligenciának sem csak egy definíciója ismert, továbbá nem keverendő össze a tudatossággal, én- és öntudattal.)

kompetens_mi0.jpg

Mustafa Suleyman (második kép), egykori DeepMind-, majd Inflection AI-társalapító, március óta a Microsoft AI, a nagyvállalat fogyasztói MI-részlegének vezérigazgatója, a 2023-as A következő hullám (Mesterséges intelligencia, technológia, hatalom és a 21. század legnagyobb kihívása) kötet szerzője szerint a szűk MI és az általános MI között is van egy fejlődési fázis. Ez a kompetens mesterséges intelligencia, az ACI (artificial capable intelligence): „olyan pont az MI és az AGI között, ami felé gyorsan közeledünk: az ACI jól teljesít összetett feladatok széles skáláján, de még így is messze van attól, hogy teljesen általánosnak lehessen nevezni.” 

Ezek a feladatok különbözőek, de kapcsolódnak egymáshoz, és az ACI megérti a látszatra különféle területek közötti összefüggéseket (például rendezvényeket szervez, vagy a repülőjegytől az étteremfoglalásokig, egy utazás összes aspektusában segíti a felhasználót) – a szűk MI egyetlen, az AGI változatos, egymáshoz nem kapcsolódó feladatokat hajt végre.

Egyes generatív modellek a szűk MI és az ACI közötti területre sorolhatók. Már nem szűk MI-k, viszont még nem is ACI-k, az AGI-től pedig messze leledzenek.

 

süti beállítások módosítása