Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Ezek lesznek 2025 legmarkánsabb mesterséges intelligencia- és adattrendjei

2024. december 23. - ferenck

A generatív MI ugyan rivaldafényben van, a mesterséges intelligencia felhasználási eseteknek azonban mindössze öt százalékát jelenti. E számok ismeretében mi várható 2025-ben MI-fronton?

Bernard Marr jövőkutató és Bryan Harris, az amerikai multinacionális analitikai és MI-szoftverfejlesztő SAS főmérnöke öt nagy trendet emel ki.

2025_trendek.jpg

Az MI-modellek eszközből termékké fejlődnek. A nagy nyelvmodellek (LLM-ek) csak a jéghegy csúcsát, a valóvilágbeli alkalmazások kis részét jelentik, de már így is megváltoztatták a mindennapos MI-élményt. Mások is, például amikor gyanús bankkártyás tevékenységről kapunk értesítést, vagy személyes vásárlási ajánlatokkal bombáznak, vagy ha az orvos adataink alapján felír egy receptet. Mindegyik esetben speciális MI-modellek dolgoznak a háttérben. A csalás-detektálástól kezdve a látórendszerek dokumentálásáig, nagyon sok hasonlóra számíthatunk.

A szintetikus adatok a következő MI innovációs hullám motorjai. A minőségi gyakorlóadat iránti kereslet növekedésével egyre jobban terjednek a gyorsan javuló minőségű szintetikus adatok („jó adat nélkül nincs jó MI”). Olyan esetekben, például csalás-detektálásnál különösen hasznosak, amikor egyrészt kevés a valódi adat, másrészt viszont létfontosságú a hatékony MI-rendszerek betanítása. Képzeljük el, hogy a tranzakciók milliói szabályosak, és minimális a csalás. Az algoritmus minősége romlik, amin csak életszerű, de szintetikus adatok, összességében kiegyensúlyozottabb adatkészletek segíthetnek.

Az MI irányítása vezetőségi szintű prioritássá válik. Mesterségesintelligencia-rendszerek egyre több kritikus döntést hoznak, ezért a szervezetek vezetőinek ismerniük kell, hol fut az MI-jük, milyen adatokon gyakoroltatták, és persze a teljesítményét is. Harris négy különálló pillérre (felügyelet, platform, kontroll, kultúra) épülő, átfogó keretrendszert vázol fel. A megfelelő felügyeletet célzott adatetikai gyakorlattal alakítaná ki, a beszámolókat közvetlenül a vezetők kapnák, ők garantálnák, hogy az MI-kezdeményezések kivitelezhetők és morálisan is vállalhatók. A platform lényege a megfelelőség szoftveres infrastruktúrába építése, amellyel az ázsiai, európai és amerikai szabályozásokat is kezelnék. A kontroll a rendszerek folyamatos monitorozása, a hatékonyság nyomon követése. A kultúra kevésbé egyértelmű, de kritikus jelentőségű: nem az algoritmus működését, hanem az MI kockázatait és előnyeit, helyes alkalmazását kell érteni.

A felhőszámítások környezeti lábnyoma, az MI globális széndioxid-kibocsátáshoz való egyre ijesztőbb hozzájárulása, plusz a kiadások növekedése költséghatékonyabb megoldások felé mutat. Első körben az optimalizálás és a fenntartható energiaforrások jöhetnek szóba.

A kvantumszámítás lesz az MI következő nagy „határterülete.” Itt várhatók 2025 legizgalmasabb, legváratlanabb újításai, optimalizálási problémákra (ellátási lánc, gyártás) különösen hatékony megoldásnak ígérkeznek. A kvantumtechnikák speciális MI-problémák megoldásához olyan mértékben járulhatnak hozzá, mint a GPU-k a mélytanulás (deep learning) forradalmához.

Ezek a trendek és konvergenciájuk az MI-lehetőségek új korszakát vetítik előre – prognosztizál Marr és Harris. A siker azonban nemcsak az új technológiák gyors adaptálásától, hanem az adatminőség megbízható alapjaitól és az irányítástól is függ. A minőségi adat komoly versenyelőnyt jelent.

A Google DeepMind készíti a legpontosabb időjárás-előrejelzést

A Google DeepMind mesterségesintelligencia-alapú időjárás-előrejelző GenCast programja jobban teljesít a napi szintű időjárás, hurrikánok és ciklonok prognosztizálásában, mint a legfejlettebb hasonló rendszerek. A világelsőnek tartott európai ENS-re (fejlesztője a European Centre for Medium-Range Weather Forecasts, ECMWF) húsz százalékot vert rá.

Napi prognózisban, de tizenöt napig extrém események terén, pusztító hurrikánok és más trópusi ciklonok útvonalának kimutatásában is pontosabbnak bizonyult. Fejlesztői szerint az ENS legyőzése fordulópont az MI-vel végzett időjárás-jelentés történetében. 

idojaras_1.jpg

A közeljövőben valószínűleg segíteni, s nem helyettesíteni fogja a hagyományos megoldásokat. De még ebben a funkcióban is pontosítja a betörő hideg- és meleg-hullámokat, szélviharokat, energiacégeknek pedig megmondja, mennyi áramot generálnak szélfarmokból.

A hagyományos fizika-alapú előrejelzések rengeteg egyenlet megoldásával készülnek, a GenCast viszont negyven év történelmi adatain gyakorolva tanulta meg a globális időjárás 1979 és 2018 közötti fejlődését: szélsebességet, hőmérsékletet, légnyomást, nedvességtartalmat, valamint további több tucat változó különböző magasságokban mért módosulásait.

A legfrissebb adatok alapján kiszámolja, hogy 28x28 kilométeres területeken tizenkét órás időintervallumokban mi várható a következő tizenöt napban. És míg a hagyományos előrejelzések többtízezer processzoros szuperszámítógépeken órákig készülnek, addig a GenCast prognózisához nyolc perc kell a speciálisan gépi tanuláshoz fejlesztett egy darab Google Cloud TPU chipen.

Az utóbbi években a Google több MI-vel működő időjárás-előrejelzőt mutatott be. A júliusban bejelentett, mesterséges intelligenciát és hagyományos fizikát összekombináló NeuralGCM-et hosszútávú prognózisokra és éghajlat-modellezésre fejlesztették. A 2023-as GraphCast az „egyszerre egyetlen legjobb becslés” elve alapján működik.

A GraphCastra épülő GenCast ötven vagy több előrejelzés-gyűjteményt generál, különböző időjárási eseményekhez pedig valószínűségeket rendel. Az időjárás-jelentés szakma üdvözölte az új technológiát, óriási lehetőséget látnak benne. A fizika-alapú prognózis MI-vel történő teljes helyettesítésétől viszont még távol vagyunk – állítják a szakemberek.

A James Webb Űrteleszkóp 2025-ben megerősítheti a földönkívüli élet létezését

Kicsi az esélye annak, hogy rövid időn belül földönkívüli élet nyomait észlelni fogjuk. De ha valamennyi mégis van, akkor leginkább a James Webb Űrteleszkópban (JWST) bízhatunk.

A JWST látókörébe került ugyanis a TRAPPIST-1 csillag, a tőlünk „csak” 41 fényévre lévő hűvös vörös törpe. Hét sziklás, Föld-méretű exobolygó veszi körül, közülük három éppen lakható távolságra van a csillagtól, ami azt jelenti, hogy a feltételek adottak a folyékony vízhez, így az élethez is.

alienek.jpg

Az űrteleszkóp az egyiken mérte is a hőmérsékletet. Ez volt az első eset, hogy a naprendszerünkön kívül bárhol is érzékeltek Föld-szerű bolygóról érkező sugárzást. Ha szerencsések leszünk, a következő mérések komoly felfedezések lehetnek. 2025-ben a JWST mindenesetre tovább fogja figyelni, és talán még alienekre is fény derül.

Exobolygókat nagyon nehéz találni, közelről megfigyelni meg pláne, mert lényegében maguktól nem termelnek fényt, és a közeli csillagok elhomályosítják őket.

alienek0.jpg

A hűvös vörös törpék, mint a TRAPPIST-1 viszont jobban vizsgálhatók, mert ugyan meglehetősen gyenge fényt, de fényt bocsátanak ki. Ugyanakkor sokkal illékonyabbak, mint az olyan stabil csillagok, mint a Nap.

A következő lépés viszont még az űrteleszkópnak is masszív kihívás, mert a csillaghoz közeli bolygók atmoszférájának összetételét kell tanulmányoznia.

Valahányszor egy bolygó elhalad köztünk és a csillaga között, megszűri a csillagfényt, és esetleg molekuláris mozgások is észlelhetők. Már amennyiben a JWST elég használható, azaz a fogadócsillag jeleit elnyomó és a sziklás exobolygók nagyon vékony légkörének molekuláris jellemzőit felerősítő adatot gyűjt.

Ha a csillagászok képesek detektálni a megfelelő molekulákat, azok alien létformák jelenlétére utalhatnak. A legvalószínűbb sikeres forgatókönyv, ha kiderül, hogy a bolygón van víz, ami hihetetlenül látványos felfedezésnek bizonyulna.

Ha viszont a TRAPPIST-1-ben csalódnunk kell, saját naprendszerünkben is találhatunk bizakodásra okot adó jeleket. A Jupiter negyedik legnagyobb holdja, az Európa felszíne alatti feltételezett óceán területe sokkal nagyobb, mint a földi óceánoké együtt. A NASA októberben indított űrszondája 2030-ban éri el az Európa hideg és folyékony világát. Rengeteg képet fog készíteni, és talán kiderül, hogy a hold lakható, és esetleg lakják is. 

Hogyan csökkentsük a rohamosan növekvő elektronikus hulladék mennyiségét?

Kínai kutatók friss tanulmánya szerint a generatív MI használatával sok-soktonnányi elektronikus hulladék termelődik 2030-ig. Nyilvánosan hozzáférhető adatok alapján négy forgatókönyvet vázoltak fel.

Az egyik a lineáris növekedést mutatja be, amellyel évi szinten 41 százalékkal több az e-hulladék. A másik háromban a kereslet exponenciális növekedésével számoltak, ami konzervatív megközelítésben évi 85, mérsékelt megközelítésben 115, „agresszív” megközelítésben 136 százalékos éves növekedést generál.

elektronikus_szemet.jpg

A tanulmányban mindegyik szcenáriót hulladékmennyiség-csökkentő intézkedésekkel és nélkülük is vizsgálták.

Az elsőben 2030-ig 1,2 millió, az agresszívben 5 millió köbtonna halmozódik fel. Ezeknél a számoknál nem vették figyelembe a technikai javításokat, de a súlyosbító elavuló technológiákat sem.

Abból indultak ki, hogy a szervereket háromévente lecserélik. Ha gyakrabban frissítik őket, amikor jobb hardverek rendelkezésre állnak, csökken az összesített számuk – mert ebben az esetben kevesebb szerverrel nagyobb feldolgozókapacitást érnek el. Viszont ha gyakrabban lecserélik a szervereket, akkor a lineáris forgatókönyvben további 1,2 millió, az agresszívben pedig 2,3 millió köbtonna hulladék generálódik.

Az amerikai kereskedelmi korlátozások súlyosbítják a problémát, mert az érintett országok kevésbé hatékony szervereket használnak, ami összességében további 14 százalékkal növeli a hulladékmennyiséget.

A kutatók több hulladékcsökkentő megközelítést tanulmányoztak.

A berendezések nem MI-alkalmazásokhoz történő újrahasznosítása, valamint a kritikus alkatrészek (például a GPU-k és a CPU-k) újrahasználata 42 százalékkal csökkentheti az e-hulladékot. A chipek energiahatékonyságának javítása és az MI-modellek optimalizálása 16 százalékos csökkenést eredményezhet. A legígéretesebb opció a szerverek élettartamának meghosszabbítása. Ha egy évvel tovább működnek, az elektronikus hulladék mennyisége 62 százalékkal csökkenhet.

Az e-hulladék nemcsak növekvő mennyisége miatt problémás, hanem azért is, mert a szerver-hardver veszélyes és értékes anyagokat is tartalmazhat. Mérgező szubsztanciák, például az ólom és a króm bekerülhetnek élelmiszer- és ivóvíz-készletekbe. De lehet bennük arany, ezüst és platina is, amellyel spórolhatunk bányászatuk anyagi és környezeti költségein. 

Hatékonyabb újrahasznosításukkal 14-28 milliárd dollár generálható. Ez azt jelenti, hogy nagyon sürgősen kellene a mainál fejlettebb újrahasznosító technológiákat kidolgozni, telepíteni.

Az emberiség évi 2 milliárd köbtonna szemetet termel, és ha az MI-hardvert és más elektronikus eszközöket átfogó módon recikláljuk és újrahasználjuk, az összesített mennyiséget ugyan csak kis mértékben csökkentjük, de még így is hozzájárulunk a fenntarthatóbb gazdasághoz.     

Valódi pénzt költenek a mesterségesintelligencia-modellek

Az ír-amerikai multinacionális pénzügyi szolgáltató, a világ legnagyobb fizetés-feldolgozó szoftverrendszerét működtető Stripe platformján lehetővé válik, hogy nagy nyelvmodellek (LLM-ek) biztonságosan költsenek valódi pénzt.

A Stripe Ágens Eszközcsomag egy könyvtár az ágensalapú munkamenetet támogató Python és Typescript számára. Ezek alkalmazásprogramozói interfészt (API) használva, hajtják végre a pénzügyi tranzakciókat.

mi_penzt_kolt.jpg

Működése a következő: a felhasználó utasítja az ágenst, hogy meghatározott időpontra és célállomásra, megadott anyagi keretek között találjon neki repjegyet. Az LLM lekérdezi a repülési adatbázist, kiválaszt egy járatot, és a felhasználótól engedélyt kap a jegyvásárlásra.

A Stripe Ágens Eszközcsomag a CrewAI, a LangChain és a Vercel ágensalapú munkamenet-kereteit támogatja. A Stripe összes API-jával egyelőre nem működik, de ami késik, nem múlik.

A könyvtár egyszeri használatú debitkártyákat képes kiállítani, így az LLM-alapú alkalmazások csak akkor tudnak pénzt költeni, ha a felhasználó is akarja. A tranzakciót valósidőben engedélyezi: mielőtt az ágens fizetne, a tervezett vásárlást jóvá tudjuk hagyatni az eladóval.

A technológiával ügyfelenként lekövethető az LLM tokenhasználata, így pedig centre kiszámolhatjuk az ügyfeleknek, hogy mennyivel tartoznak nekünk az általunk fejlesztett ágensek használatáért.

A Stripe korlátozott API-kulcsokat biztosít, amivel limitálhatjuk az LLM által kérhető API-hívások tartományát.

A biztonságosan pénzt költő ágensek változatos alkalmazásokkal kecsegtetnek. A Stripe API-ja korábban ugyan lehetővé tette már LLM-alapú alkalmazás online vásárlásait, amelyekhez azonban meg kellett bízni az LLM-ben, hogy tényleg a megfelelő API-hívásokat generálja. Az új könyvtárral könnyebb a kiadási és az API-korlátok betartatása.

Ez pedig az elektronikus kereskedelem biztonságát növeli, felgyorsulhat a valóban megbízható ágensek fejlesztése. 

Ezek a trendek fogják meghatározni 2025-ben az oktatást

A hagyományos oktatási modell egyre kevésbé illik a gyors technológiai változások miatt is átalakuló társadalomba. Régebben kevésbé értékelt adottságok, mint az érzelmi intelligencia és a kommunikációs készség kitüntetett szerephez jutnak a mind inkább gépek által meghatározott közegben, ahol a rutinfeladatok jó részét programok végzik el.

Bernard Marr jövőkutató 2025 oktatását meghatározó hét technológiai trendet emel ki.

2025oktatas.jpg

Ahogy a gépek egyre jobban teljesítenek számításokban, trendek elemzésében, beszámolók generálásában, az ember-központú, „szoft” adottságok markánsabb szerepet kapnak a tantervben: az érzelmi intelligencia és a kommunikáció mellett a kritikus gondolkodás, a nagy egészre vonatkozó stratégia, vezetőkészség, csapatmunka erősebben integrálódik a mainstream oktatásba.

Egy friss felmérés alapján a dolgozók 57 százaléka szerint a generatív MI-vel eredményesebb a munkájuk. A ChatGPT és társai az oktatásban is terjednek: tanárok tanítják biztonságos használatukat, osztályozásnál segítenek, személyre szabott tanácsokat adnak a modellek. 

A személyre szabás nemcsak az MI esetében egyre hangsúlyosabb. Minden tanuló más, így a legjobbat úgy lehet kihozni belőlük, ha személyiségükhöz leginkább passzoló oktatást kapnak. 2025-ben sok ilyen típusú pilotprojektre számíthatunk.

Az életen át tartó tanulásban nincs sok új, de a koncepció ennek ellenére minden évben meghatározó. 2025-ben sem lesz másként, sőt, a technológiai adottságok javítására minden eddiginél nagyobb hangsúlyt fektetnek. Online oktatás, moduláris, mikro- és nanotanulás – ízelítő a választékból…

Az egyre több online platformmal a virtuális és a kiterjesztett valóság is nagyobb szerephez jut, masszívabb hozzáféréssel, immerzívebb megoldásokkal – és persze a távoktatás sem tűnik el.

Gyakoribbak lesznek az oktatási intézmények és vállalatok közötti együttműködések. A vállalatok jövőbeni munkáltatókként is megjelennek, ami különösen a technológiákra érvényes, mert folyamatosan nő a high-tech területeken, főként a mesterséges intelligenciában és a cyberbiztonságban tehetséges diákok iránti igény. Ha már tanulmányaik során együttműködnek potenciális leendő alkalmazóikkal, a jövőben gördülékenyebben megy majd a közös munka.

Az Ed-Tech (oktatástechnológiai) iparág 350 milliárd dolláros üzletté válik 2030-ig. A befektetők száma és a befektetések összege nő, az innováció úgyszintén. Minden feltétel adott lesz, hogy az oktatás megfeleljen a változó világ elvárásainak. 2025-ben ebből már remélhetőleg sokkal többet fogunk érzékelni, mint 2024-ben. Az új modell sokkal dinamikusabb, alkalmazkodóbb és emberközpontúbb a réginél.

A gyémánt többmillió évre megoldja az adattárolás problémáját

Képzeljük el, hogy a távoli jövőben leszármazottaink, vagy belőlünk kifejlődött új, poszthumán fajok ma még szinte felfoghatatlan módszerrel férnek adatainkhoz, és élhetik át civilizációnk történetét. 

Az ötlet hamarosan valósággá válhat, ugyanis kínai kutatók szerint gyémántalapú tárolótechnológiával köbcentiméterenkénti 1,85 terabájt, azaz óriási mennyiségű információ évmilliókig megőrizhető.

gyemant.jpg

Az információt a gyémánt atomszerkezetében kódoló technológiát fejlesztettek. Az eszköz a fluoreszkáló üres részeket robusztus tárolási egységekként használja ki. A tárolási sűrűség nagyon magas, az írási idő 200 femto-másodperc, a karbantartás-mentes élettartam évmilliókban mérhető – magyarázzák a kutatók.

A digitális kor folyamatosan növekvő adataival, szükség is van újfajta tároló megoldásokra. A hagyományos eszközök, mint a CD-k, pendrive-ok, Blu-ray lemezek belevesznek az adattengerbe. A gyémántalapú optikai lemez adattárolási sűrűsége viszont kétezerszer nagyobb, mint a szabvány Blu-ray lemezeké.

gyemant0.jpg

Az új adattároló előállítása azonban meglehetősen bonyolult. Apró gyémántszilánkokat használtak hozzá, ultragyors lézerimpulzusokat lőttek ki rájuk. Néhány szénatomot így kiszorítva, pirinyó üres helyeket hoztak létre a gyémánt kristályrácsában.

Az „üres terek” az információtárolás építőkockái. Az üresedések sűrűsége egy adott területen meghatározza a különféle adatértékeket jelentő fényességet. Az üresedés-mintázatok aprólékos irányításával/kontrolljával a kutatók adatokat tudtak kódolni a gyémántban.

A rendszer képességeit a fotótörténet egyik klasszikusa, Eadweard Muybridge (1830-1904) fényképek híres szekvenciájával szemléltették. Tárolásukat úgy oldották meg, hogy az egyes pixelek fényerejét a gyémánt belsejében lévő meghatározott helyek fényerőszintjéhez rendelték. A tárolás és a visszakereshetőség 99 százalékos pontosságot ért el.

Ez a szám azt jelenti, hogy a technológia megfelel a digitális adattárolás gyakorlati követelményeinek, ígéretes a jövőre nézve. Kereskedelmileg viszont egyelőre kivitelezhetetlen, mert túl drágák a speciális eszközök (lézerek, ultragyors fluoreszkáló képkamerák stb.).

Idővel méretezhető, miniatürizálható, összességében pedig megfizethetőbb és hozzáférhetőbb lehet a technológia. A hosszútávú adatmegőrzésben érdekelt vállalatok, illetve az értékes történelmi és tudományos adatokkal dolgozó intézmények számára minden bizonnyal vonzó megoldás. Ők lehetnek az első alkalmazók.

Katasztrofális vége lehet Elon Musk 2050-es Mars-városának

A SpaceX vezérigazgatója évekkel ezelőtt felvetette, hogy állandó marsi település létrehozásával, az emberiség interplanetáris fajjá változik. Tervei alapján gigantikus Starship rakétájának segítségével 2050-ben mintegy millió telepes élhetne a Vörös Bolygón. Az emberi tudatosság így élhetné túl a Földre leselkedő katasztrófákat, de legalábbis a világűrbe kirajzás az egyik opció.

A vállalkozás mindenesetre kockázatosnak tűnik. Kelly Weinersmith biológus 2023-as beszédes című Város a Marson: letelepedhetünk-e az űrben, le kellene telepednünk az űrben és tényleg átgondoltuk ezt? könyvében leírja, hogy a barátságtalan környezet borzalmas választás. Kifejezetten szkeptikus, mert az elhúzódó és rendkívül költséges vállalkozás epikus nagyságú humanitárius katasztrófával érhet véget.

mars_varos.jpg

Lehetetlennek tartja egymillió ember tragikus következmények nélküli letelepedését. Elképzelhető, hogy a közeg szülésre sem alkalmas, vagy ha mégis, szülők és gyerekek hamar meghalnak. Az önfenntartás nem menne máról holnapra, generációk komoly erőfeszítései kellenek majd hozzá. Jelenlegi ismereteink alapján a bolygó egy csomó kutatótevékenységre nagyszerű hely, ezért elképzelhetőnek tartja, hogy 2050-ig ember landol a Marson, felfedező tevékenységet végez, aztán visszajön a Földre, de az űrbéli sugárzásnak való nagymértékű kitettség miatt a környezet tényleg nem alkalmas az emberi szaporodásra. Minden élettevékenységet megnehezít, hogy a felszíni gravitáció mindössze a földi harmincnyolc százaléka.

A Mars gyarmatosítása más kutatók szerint is nagyon sok problémát felvet. Politikai, technológiai és morális kérdéseken túl, az ottani élet még a világ leggazdagabb embere, azaz a Tesla-főnök számára is megfizethetetlenül drága lehet.

Barack Obama volt amerikai elnök szerint a Föld egy esetleges atomháborút követően is élhetőbb lenne a Marsnál, mert itt legalább van elegendő oxigén.

Maga Musk sincs meggyőződve a sikerről, viszont óriási kihívásnak tartja a Mars-utazást, és a következő években valószínűleg mindent meg fog tenni a Vörös Bolygóra induló missziók felpörgetéséért. Ami persze messziről sem jelenti azt, hogy 2050-ben egymillió ember fog ott élni.

Robotok házimunkát végeznek

A robotok elég lassan profitáltak a gépi tanulásból, de úgy tűnik, hogy a generatív mesterséges intelligencia felgyorsítja a folyamatot, és az integráció konkrét alkalmazásokkal kecsegtet.

Nagy nyelvmodelleket (LLM) használva, a gépeknek angolul adhatók utasítások. A San Franciscói Physical Intelligence startup megfelelő méretű és változatos adatbázissal kidolgozott és praktikus cselekvésekre tanítottak be robotokat. Otthoni alkalmazásukra ugyan várni kell még, a teszteken viszont demonstrálták, hogy valóban hasznos házimunkákat képesek meglepően ügyesen elvégezni.

robot_hazimunka.jpg

A Physical Intelligence ԯ0 (pí-zéró) gépi tanulás rendszerével magas szintű koordinációt és ügyességet igénylő feladatokat végeztek el robotkarok, például ruhákat hajtogattak össze, asztalokat takarítottak le. A cégbe az OpenAI, Jeff Bezos és Szilícium-völgyi kockázati tőkés-csoportok máris 400 millió dollárt invesztáltak.

Az előre gyakoroltatott PaliFGemma gépilátás-modell módosított változatán alapuló ԯ0 a szokásos módszerrel, zajeltávolítással működik, míg végül felhasználói utasításra a robot szenzorainak inputjaival (például a környezetről készített felvételekkel), beágyazásokkal és következtetéssel éri el a kívánt eredményt.

robot_hazimunka0.jpg

Hangutasításra egyetlen robotkar százszázalékos pontossággal rakott egymásra nagyméretű tálakat. Más gépitanulás-modellekkel (OpenVLA, Octo, ACT) megközelítőleg sem ért el ilyen jó eredményt, csak negyvenöt-ötvenöt százalékot. A ԯ0 összesítve nyolcvan százalék felett teljesített, több tíz százalékpontot rávert a riválisokra.

Alkalmanként persze ő is hibázik. Egy videón például a kar túl sok tojást rakott a dobozba, és erőltette, hogy záródjon le. Egy másikon ahelyett, hogy megtöltötte volna tárgyakkal, a konténert lehajította az asztalról.

A Physical Intelligence fejlesztése mindenesetre kapcsolódik a kereskedelmi robotika újjászületéséhez. A Skild általános rendeltetésű agyat fejleszt hozzájuk, a Figure AI humanoid robotjait multimodális MI-modellek működtetik, az ipari gépeket fejlesztő Covariant az Amazon technológiáját használja, az OpenAI pedig újraindította 2020-ban bezárt robotika részlegét. 

A ԯ0-t egyesek máris a robotika GPT-1-eként emlegetik.     

Mesterségesintelligencia-ágensek térítik meg egymást a Minecraftban

A Minecraft videójáték egyre népszerűbb mesterségesintelligencia-modellek és ágensek tesztelésére. Az Altera startup ezernél több, nagy nyelvmodellek (LLM-ek) által működtetett szoftverágenst bocsátott útjára, hogy ne csak túléljenek, hanem folytassanak interakciókat is egymással.

Csak szöveges utasításokat, promptokat kaptak, de így is, bármilyen további humán input nélkül személyiségjegyek, preferenciák és speciális szerepek figyelemre méltó skáláját fejlesztették ki. Spontán barátkoztak, találtak ki munkákat, mémeket osztottak meg, adóreformról szavaztak, sőt, még vallást is terjesztettek.

minecraft_1.jpg

A vallás persze paródia volt, az abszolút fiktív pasztafarianizmust igyekeztek propagálni a környező városokban. 

Mindez azt jelenti, hogy MI-ágensek feladatokat képesek végrehajtani, az autonómia jeleit mutatják, kezdeményeznek dolgokat digitális környezetekben. Viselkedésük egyszerre lenyűgöző és bizarr. Fejlesztőik nagyratörő terveket dédelgetnek velük kapcsolatban.

minecraft0_1.jpg

A korábban az MIT-n (Massachusetts Institute of Technology) számítógépes idegtudományt tanított Robert Yang, az Altera alapítója a Minecraft-próbálkozást nagyléptékű „MI-civilizáció” felé vezető kezdeti lépésnek látja: ágensek együtt élhetnek, kooperálhatnak és dolgozhatnak a digitális közegben. A mesterséges intelligencia potenciálját akkor aknázzuk ki, ha valóban autonóm ágensek tömege képes lesz együttműködni – állítja Yang.

Sid projektjét a Stanford Egyetem 2023-as huszonöt ágenses kísérlete ihlette meg. Ezek az emberszerű viselkedést mutató autonóm ágensek nagyon egyszerű digitális környezetben érintkeztek egymással. Yang a lehetőségek határáig akarta pörgetni az eredeti ötletet.

Szimulált ágenseik többrészes modulokból álló „aggyal” rendelkeznek. Egyes modulok LLM-mel működnek, feladatokra, például más ágensekre történő reagálásra, beszélgetésre vagy a következő lépés megtervezésére specializálták őket. Tizenkét játéknap (a valóságban négy óra) alatt jutottak el érdekes emergens karakterjegyekig: egyesek szociálisak voltak, kapcsolatokat alakítottak ki, míg mások introvertáltak maradtak. Kedvelhetőségük (lájkolhatóságuk) interakcióikkal párhuzamosan, folyamatosan változott.

A huszonöt ágensest harmincas, ötvenes, ötszázas és maximum ezres szimulációk követték. A következő lépésekben élőbbé kell tenni őket, és a Roblox virtuális környezetben szintén meg fognak jelenni. Yang azt akarja elérni, hogy ember és ágens között napi kapcsolatok alakuljanak ki, és úgy kötődjenek hozzánk, mint a kutyák: szeressenek minket. Ami persze egyáltalán nem biztos, hogy meg is történik, mert a legfejlettebb GPU-n futó legfejlettebb neurális hálónak sincs öntudata, az öntudatnak még a csíráit sem figyelték meg náluk.

süti beállítások módosítása
Mobil