Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Falon mászik Marvel, a dél-koreai robotkutya

2022. december 21. - ferenck

Szintet lépnek a robotkutyák.

A KAIST (Korea Advanced Institute of Science and Technology) kutatói különleges négylábú robotot fejlesztettek. A tetszetős külleműnek nem nevezhető gép felfelé mászik vas-, acélfalakon, és a mennyezeteken is elboldogul. Mindet úgy megmássza, mint az óriásrovarok.

marvel.jpg

MARVEL a neve, de ezúttal se képregényekre, se filmekre ne gondoljunk, mert a szó a „mágnesesen tapadó robot a sokoldalú és gyors mozgáshoz” (Magnetically Adhesive Robot for Versatile and Expeditious Locomotion) rövidítése, a szavak első betűiből áll össze.

Alig több nyolc kilónál, és harminchárom centiméter hosszú, és nem magasabb egy játékbabánál.

marvel0.jpg

Nem ő az első faljáró robot, korábban is fejlesztettek hasonló rendeltetésű gépeket, de a többivel ellentétben, kerekek, fogantyúk, tapadókorongok és propellerek helyett mágneses lábakkal viszi, hajtja magát felfelé.

Tervezői elmondása alapján nagyon ügyes, meggyőzően navigál íves felületeken, például rozsdás fémtartályokon. Ez részben az elektromágneses lábaknak, illetve egy különleges elasztomernek (elasztikus polimernek) – okos anyagnak – köszönhető. Részben abból alakították ki.

Lábügyessége miatt valószínűleg sokan meg fogják vásárolni. A fejlesztők egyrészt ipari környezeteket, másrészt magasságuk miatt ember számára nehezen megmászható és veszélyes közegeket emelnek ki a potenciális alkalmazási területek közül: hidakat, hajókat, toronyházakat.

MARVEL gyors is, nehezebb terepen 0,3 méter per másodperc a maximális sebessége. Elkerüli a kitüremkedéseket, átlépi az akadályokat, például kisebb-nagyobb réseket. Könnyű felületeken, mint a sima falak és a plafon másodpercenkénti 0,5-0,6 méteres sebességre is képes. Ő az eddigi leggyorsabb vertikális és fordított mozgású falmászó robot.

A fejlesztők szerint bőven akad finomítanivaló rajta, mert el kell még sajátítania a nagyon szabálytalan és meredeken ívelt felületeken történő felfelé mozgást is.

Újratervezi önvezető autóját az Apple

Nyílt utakon egyelőre csak néhány teljesen önvezető autó közlekedik: kínai és amerikai robottaxik.

Az utóbbi pát évben az iparágnak komoly problémákkal kellett szembenéznie. A Ford leállította a Volkswagennel közös Argo projektet, a Tesla állítólagos teljes egészében önvezető járgányába pedig, mint kiderült, mégiscsak kell ember. A további fejlesztésekhez folyamatosan figyelembe kell venni, hogy ezeknek az autóknak, legyen havazás, vagy útépítés, mindig és minden körülmények között biztonságosan kell közlekedniük.

Az Apple 2025-re tervezte a Titan kódnevű önvezető jármű bevezetését, idén viszont rájöttek, hogy kicsúsztak a határidőből, és az autonóm funkciókat is át kell értékelniük.

apple.jpg

Az új ütemezés alapján a prototípus 2024-re készül el, a tesztekre 2025-ben kerül sor, míg a nagy bemutató 2026-ban lesz. A megcélzott százezer dolláros bevezető ár húszezerrel kevesebb, mint az eredetileg tervezett.

A nagyvállalat jelenleg több amerikai szövetségi államban, Lexus SUV-okon teszteli a Titan félautomata rendszerét.

Azaz, az Apple újratervezi a közel egy évtizede fejlesztésben lévő autonóm autót. Eredetileg úgy képzelték el, hogy minden körülmény között teljesen automata lesz, a mostani tervek szerint viszont – valamilyen szinten – humán vezető is működtetheti.

Az első tervekben az utastér összes ülése a középpont felé nézett, a járműben nem lett volna kormánykerék, gázpedál. A mostaniakban viszont már az emberi irányítás is megvalósítható.

A jármű autópályákon autonóm módban fog közlekedni, miközben a vezető például filmet nézhet, videojátékkal szórakozhat. A rendszer figyelmezteti, ha manuális irányításra van szükség, mert mondjuk, pocsék az útminőség, vagy rossz idő van.

Az önműködő rendszer lidar-, radar- és kameraadatokat használva navigál. A Denali nevű fedélzeti processzor hajt végre egyes feladatokat, míg a többit az Amazon Webszolgáltatások kezeli a számítási felhőben. Sürgősségi esetekben távoli operátorok vehetik át az önvezető autó irányítását.

A teljesen önvezető autók kereskedelmi forgalmazása látványos, de az időben egyre tolódó cél. Az Apple a biztonság kedvéért meghozott döntése arra enged következtetni, hogy a belátható jövőben (majdnem) mindig lesz humán vezető a járműben.

Hogyan moderálja a mesterséges intelligencia a közösségimédia-tartalmakat?

Milyen szerepet kellene játszania a mesterséges intelligenciának a napi sokmillió közösségimédia-poszt, komment, üzenet moderálásában? – teszi fel a kérdést Andrew Ng, a gépi tanulás egyik legismertebb szakértője.

Annyi a poszt, üzenet, hogy mennyiségük automatizálás nélkül kezelhetetlen, ugyanakkor különbséget kell tenni a mérsékletes moderálás és az elfogadhatatlan cenzúra között.

Az MI egyrészt hasznos segédeszköz a moderálási politika bővítésében, másrészt viszont nem kezeli a lényeget: mi megengedhető, és mi nem? Ezt a kérdést mesterséges intelligenciának és embernek egyaránt nehéz megválaszolnia.

socialmedia_content.jpg

Például azért, mert maga a nyelv is többértelmű, ellentmondásokkal teli. Ha azt mondjuk, hogy „ne hagyjuk, hogy ezt is megússzák”, az ugyanúgy lehet erőszakra való felszólítás, mint az igazság vágya. Vagy „az oltásnak vannak veszélyes mellékhatásai” ugyanúgy lehet tudományos tény, mint félretájékoztatás.

A szavak jelentése, értelmezésük személyről személyre változik. Egyiket-másikat csak egy szűk csoport érti, például tudományos csapatok mások számára ismeretlen rövidítéseket használnak, de gyűlöletcsoportok és bűnözők is kódolt szövegekkel álcázzák tevékenységüket.

Ha emberek másként értelmezik ugyanazokat a szavakat, akkor hogyan gyakoroltassuk az MI-t, hogy észrevegye a különbségeket? Ha egy szöveg jelentése nem egyértelmű, akkor az értelmezésére sincs magától adódó gépi stratégia. Vagy mutassuk meg A-nak, B-nek viszont nem? Esetleg a „szerző” szándéka alapján moderáljuk ki?

Egyik megoldás sem kielégítő.

Mindezek után, az MI-rendszer felépítéséhez szükséges adatok kiválasztása is problémás, mert maga a válogató is többféleképpen értelmezheti azokat. Ahány közösség, annyiféle értelmezési opció, és ez így sajnos teljes mértékben követhetetlen.

De még ha a jelentés egyértelmű is, attól a helyes döntés meghozása változatlanul nehéz.

Szerencsére a közösségimédia-platformok aszerint válogathatnak opciók között, hogy az üzenet mennyire kirívó, milyen szintű bizalmatlanság után problémás.

Az MI úgy dönthet, hogy kisebb nyilvánosságnak mutatja meg, figyelmeztető címkét tesz melléje, vagy előbb ideiglenesen, utóbb végleg felfüggeszti a posztolót. A potenciális következmények megteremthetik a felhasználók – és a társadalom, hangsúlyozza Ng – elhallgattatása és védelme közötti egyensúlyt.

Mindezen hiányosságok ellenére, az MI jobbá teszi a közösségi médiát. Képzeljük el, mekkora káosz lenne, ha e-mailjeinket nem szűrnék a levélszemétre szakosodott mesterséges intelligenciák. Ehhez hasonlóan, a leginkább spam és toxikus közösségimédia-tartalmak kiszűrésében is kulcsszerepet játszanak.

Azonban a moderáció okozta kihívás nagysága egyelőre meghaladja az MI képességeit. A kihívás nagy, nyílt vitákkal juthatunk el a megoldásig, és addig, hogy nincs tökéletes megoldás.

A közösségi média előnyeinek maximalizálása a lényeg – összegez Ng.

Arcfelismerés után itt a fülfelismerés

A Georgia Egyetem kutatásának eredményeként, arc és ujjlenyomat után/helyett hamarosan a fül alapján is azonosíthatnak majd személyeket. A testrész ugyanolyan egyedi, mint a másik kettő, és még az egypetéjű ikreknél is lehetnek különbségek.

A fül az életünk során viszonylag változatlanul maradó kevés emberi testrész egyike. Egyedül a fülcimpa módosulhat szignifikáns mértékben. Ez a tény azt jelenti, hogy az arc- és az ujjlenyomat-felismerés nagyon hasznos technológiai alternatívája lehet.

A felsőoktatási intézmény kutatói által fejlesztett rendszer, a teszten használt adatsor és modell függvényében, akár kilencvenkilenc százalékos pontossággal is képes dolgozni.

fulfelismeres_1.jpg

A szoftver az arcfelismeréshez hasonlóan működik. Ha új telefont veszünk, vagy ujjlenyomattal vagy arccal kell regisztrálnunk, ujj esetében akár többször meg kell ismételni, míg az arcunkat többféle irányba mozgathatjuk, tarthatjuk.

A telefon több képet rögzít a személyről, és (ideiglenesen) tárolja azokat. Bejelentkezéskor, ahogy az „élő” ujjlenyomatot összehasonlítja a tárolttal, ugyanúgy tesz a füllel is.

A technológiával korábban is próbálkoztak már, de talán azért nem terjedt el, mert a másik kettő (és az írisz is) felhasználói szempontból sokkal kényelmesebb.

Nehezebb fülszelfit készíteni.

A szoftver fülfelismerő algoritmussal dolgozik, az értékeli ki a szkeneket, és dönti el, hogy alkalmasak-e az automatizált párosításra. Sokféle fül-adatsoron, változatos fülpozíciókkal gyakoroltatták.

Két különféle adatsoron tesztelték. Az egyiken 97,25, a másikon 75,11 százalékot ért el, míg a korábbi legfejlettebb fülazonosító 58,72 és 45,8 százalékot teljesített.

Zsúfolt képekkel szintén működik. A fejlesztők változatos – torzított, homályosabb, kontrasztosabb, világosabb, „zajosabb” – képeken több modelljüket tesztelték.

A szoftver telefonos azonosítás mellett más biztonsági alkalmazásokban, kameraalapú rendszereknél, például reptereken is használható. Algoritmusát továbbfejlesztik, hogy hőképekkel és sötét környezetben is elboldoguljon, ahol hagyományos kamerákkal nehéz jó fotót készíteni.

Drónok a kihalás szélén álló növényeket találtak

A Hawaii Nemzeti Trópusi Botanikus Kert (NTBG) nonprofit szervezet és a szövetségi állam Erdészeti és Vadvédelmi Osztályának tudósai drónokat használnak kihalás szélén álló növények felkutatására. Ezek a növények sziklákon vagy más, nagyon nehezen megközelíthető helyszíneken találhatók.

A növényvilág helyzete napjainkban egyáltalán nem bíztató, mert minden öt fajtából kettő veszélyeztetett. Szigeteken gyakran még rosszabb, mert nagyon sok a csak az adott helyen és sehol máshol nem élő (endemikus) faj.

dronok_hawaii_1.jpg

Ben Nyberg, az NTBG kutatója és a kanadai Outreach Robotics közösen fejlesztette a drón alatt kábelen lógó Mamba (többrendeltetésű, két irányban aktivált légi manipulátor) rendszert, egész pontosan egy távirányított robotkart. A kar leválhat a drónról, és akár négy méterről is képes veszélyes terepeken növényi mintákat gyűjteni.

Korábban vállalkozó kedvű, merész botanikusok, a sziklákat kötélen megközelítve végezték ezt a gyűjtőmunkát. Nem volt egyszerű dolgok, és könnyen tévedhettek is. Az új technológiákkal a probléma szerencsésen megoldódott.

A kar eddig tizenkét veszélyeztetett növényfaj huszonkilenc dugványát, magját gyűjtötte össze Kauai szigetén. Háromról azt hitték, hogy már kihaltak, másokból (amelyekből maximum százat feltételeztek) pedig meglepően sok példányt találtak. A szigeten kétszázötven endemikus növényfaj él. 2020-as becslés alapján az ottani növények tíz százaléka már kihalt, és nyolcvanhét százalékuk veszélyeztetett.

Létüket invazív állatfajok, mint például a vaddisznók, természetes környezetük elvesztése és a heves esőzések utáni földcsuszamlások teszik nehézzé, és sodorják a pusztulás szélére őket.

A drón közel egy év kutatómunka során közel 5500 új példányt talált, ami az előzetesen feltételezett mennyiség több mint kilencszáz százaléka.   

Nyberg szerint ezeknek a növényeknek a robotkar jelentheti a kihalás és a túlélés közötti különbséget.

A DeepMind modellje az embernél is jobban kódolhat

A mesterséges intelligencia kontra ember „meccseket” főként táblás, esetleg videojátékokból ismerjük, és tudjuk: az MI egyre jobban teljesít, egyre több területen diadalmaskodik.

Egy programozói verseny viszont sokkal nagyobb kihívás. Képzeljük el, hogy az MI és emberek ezt teszik.

Jó hír, hogy már nem is kell elképzelnünk, mert az Alphabethez (Google) tartozó DeepMind az AlphaCode modell részvételével rendezett ilyen versenyeket. Az MI jól teljesített, de nem ért el semmilyen kimagasló, szenzációszámba menő – szalagcímekre kívánkozó – eredményt. Nagyjából annyit nyújtott, mint egy néhány hónap, maximum egy év gyakorlattal rendelkező, kezdő programozó.

deepmind_alphacode.jpg

A DeepMind elmondása alapján a teszten „kb. emberi szintet” hozott, és kódszegmensek előrejelzésével, valamint többmillió potenciális opció generálásával korábban nem ismert természetes nyelvi problémákat oldott meg. Az opciók számát aztán maximum tízre szűkítette. A számítógépes kód szerkezetére vonatkozó, előzetesen beintegrált ismeretek nélkül jött rá ezekre.

Friss versenyek szimulált kiértékelésein 54,3 százalékot ért el, 66 százalékukat elsőre teljesítette. Problémánként csak tíz megoldást generálhatott.

Ha ezt a teljesítményt összevetjük mesterséges intelligenciák, köztük a DeepMind MI-jei bonyolult táblás játékokban elért eredményeivel, akkor nem nevezhetjük nagyon meggyőzőnek. A kódoló verseny nehézségi szintjét figyelembe véve viszont már inkább. Először AlphaCode-nak természetes nyelven kellett megértenie komplex kódolási problémákat, majd kóddarabkák memorizálása helyett inkább előre nem jelzett problémákra kellett következtetnie.

Megoldotta, pedig nem ismerte őket, és arra sincs bizonyíték, hogy a korábbi gyakorlóadatokból másolt volna valamit. Mindezek tudatában a DeepMind kutatói „komoly előrelépést” emlegetnek. Ráadásul a feladat nehézségi foka sem számít az MI-nek.

Nem ő a kódolásra is használható egyetlen nyelvi modell – az OpenAI GPT-3, illetve a (Microsofthoz tartozó) GitHub Copilot modellje is képes rá. Mindez azt jelenti, hogy a mesterséges intelligencia általi kódgenerálás kezdeti korszakában járunk, a DeepMind viszont bizakodik, plusz az AlphaCode fejlesztők új generációja számára teheti hozzáférhetőbbé a programozást, sőt, valamikor paradigmaváltást is okozhat a területen: az ember formába önti, az MI megoldja a problémákat.

Altatótörténeteket mesél gyerekeknek Alexa, az Amazon intelligens asszisztense

Komoly nyomás nehezedik az Amazonra, hogy újraélessze, új élettel töltse meg az Echo termékvonalat (a cég intelligens hangszórói). Értékesítésük eleve veszteséges, de a nagyvállalat abban bízott, hogy más áruk vásárlására ösztönöznek. 2022-es eddigi veszteségük viszont tízmilliárd dollár, és következményként, az Alexa szoftver fejlesztőrészlegére is elbocsátások várnak.

Eközben 2022 a szöveget, képet, videót és zenét generáló mesterségesintelligencia-modellek éve, és ebből Alexa sem maradhatott ki. Történetmesélő funkciójában több generatív modellt koherens egésszé kombináltak össze. Az persze más kérdés, hogy milyen eladásokat produkálnak vele.

alexa.jpg

De miről is van szó?

Képzeljük el, hogy nagyon fáradtnak érezzük magunkat, esetleg kifogytunk az ötletekből, és képtelenek vagyunk gyerekünknek lefekvés előtti történetet, mesét mondani.

alexa0.jpg

Itt jön képbe az Amazon az intelligens kijelzőjével, az Echo Show eszközzel, amelyen igény szerinti, személyre szabott sztorik pereghetnek.

Az Alkoss Alexával (Create with Alexa) funkcióval gyerekeknek szóló történetek hozhatók létre, képi illusztrációval, zenével és hangeffektusokkal.

alexa1_1.jpg

A képernyőn a beállításra vonatkozó promptok (utasítások) sora jelenik meg, például „a világűr felfedezése”, vagy „elvarázsolt erdő”, főszereplővel, mondjuk, egy űrhajóssal vagy földönkívülivel, meghatározó színnel, tónussal (vidám, titokzatos stb.).

Választásaink után, írott történeteken gyakoroltatott nyelvi modell öt jelenetre bontott öt-tízsoros szöveget hoz létre. Minden egyes jelenethez jelenetgeneráló modell választja ki egy könyvtárból a megfelelő háttérképet. A könyvtárban ember által alkotott és mesterséges intelligencia által generált képek egyaránt találhatók.

A modell tárgyakat és karaktereket ad hozzá, a szöveghez kapcsolódó arckifejezésekkel és gesztusokkal, például kezével integető, mosolygós arcú kalózt és másokat.

A hanggenerátor az audió-könyvtárban lévő akkordok, harmóniák és ritmusok közül választja ki, és keveri egybe a sztorihoz leginkább passzoló anyagot.

Mindezek után a mesterséges intelligencia álomba ringatja a gyereket.

Nem biztonságosak a kriptovaluták a mesterséges intelligencia számára

Az FTX kriptovaluta-tőzsde látványos összeomlása a mesterségesintelligencia-biztonsággal foglalkozó több cég finanszírozását veszélyezteti.

A novemberi csőd hetvennél több mesterségesintelligencia-kutatásokban érintett vállalatot hozhat kellemetlen helyzetbe. Összesen közel 550 millió dollár támogatást kaptak az FTX-től, amelynek jelentős részét valószínűleg vissza kell majd fizetniük.

A 2019-ben alapított FTX lehetővé tette ügyfeleinek kriptovaluták hagyományos pénzre és más eszközökre történő váltását, a velük folytatott kereskedését. Egy novemberi beszámoló az FTX vezetése és a vezetőséghez tartozó másik kereskedőcég potenciális konfliktusáról írt, majd a hír hallatán, a felhasználók elkezdték kivenni a befektetéseiket, amelyek jelentős részét az FTX már elköltötte. Erre jött a csőd, az ügyészek és a szabályozók lehetséges bűntények után nyomoznak jelenleg. 

ftx.jpg 

Sam Bankman-Fried társalapító-vezérigazgató és üzlettársai a tőzsdei részesedésükből adományokkal és befektetésekkel segítettek MI startupokat, laboratóriumokat, szellemi műhelyeket is.

Ezeknek a szervezeteknek a nagy része az MI-biztonságra összpontosít. Hozzájuk kapcsolódó személyek névtelenül elmondták, hogy tartanak a támogatások csődeljárás közbeni visszakövetelésétől.

Az Anthropic független kutatólabor például 500 millió dollárt kapott segítőkész és ártalmatlan nyelvi modellek fejlesztésére.

Az FTX vezetői által indított Future Fund az emberiség jövőjét szolgálni hivatott projekteket támogat, amelyből harmincmillió MI-biztonságra ment. Az alap hatmilliót fordított a nagy nyelvi modellek által generált biztonsági problémák, például a félretájékoztatás mérséklésére. 1,5 milliót adtak a Cornell Egyetemnek, 1,25-öt pedig egy, az emberiség érdekei elleni mesterségesintelligencia-szcenáriókat és azok megvalósulásának megakadályozását vizsgáló kutatóközpontnak.

Az MI-biztonság, a mesterséges intelligencia által okozott károk megakadályozása, de legalábbis minimalizálása hiába kulcsfontosságú, az ezzel foglalkozó szervezetek sem a vállalati szektorból, sem az anyagi javakban szintén nem bővelkedő akadémiai intézményektől nem kapnak elég támogatást.

Az FTX nagyon jól jött nekik, most viszont más támogatók, befektetőik után kell nézniük. Sokuk jövője pedig teljesen elbizonytalanodhat. 

Puha robotok segítik a sebészeket

A katéter vékony, műanyagból, gumiból, szilikonból, fémből vagy üvegből készült kis cső vagy slag, amivel az üreges szerveket, mint a húgyhólyag, a gyomor, a belek, különböző edények, a fül vagy a szív meg lehet szondáztatni, ki lehet üríteni, fel lehet tölteni vagy ki lehet öblíteni” – írja a Wikipédia az utóbbi évtizedek sebészetét jelentősen átalakító eszközről.

A mai katéterek gondos mérnöki munkával kialakított robotikus szerkezetek. Hozzájárulnak, hogy a sebész minél kevésbé invazív módon hajtsa végre a beavatkozást, szervezetbe juttatásuk viszont még mindig manuális és időigényes folyamat.

A funkcionális rostok és az intelligens robotika gyors fejlődésének eredményeit összekombinálva, svájci és brit kutatók katéter-formájú távirányítható, sőt, félautomata módban is működő puha robotot fejlesztettek.

soft_robot.jpg

Ez az első eset, hogy ilyen szerkezetek méretezhetők, összetett funkciók integrálhatók beléjük, és potenciálisan a szervezeten belül is irányíthatók.

Korábban csak kemény anyagokkal végzett ezúttal speciális hőtani eljárást („hőrajzolást”) alkalmaztak puha anyagokra, elasztomerre, azaz elasztikus polimerre, abból készítették a szerkezeteket . Rugalmassága és puhasága miatt esett rá a választás. Miután kinyújtjuk és elengedjük, „visszamegy” az eredeti állapotába, és elég puha is ahhoz, hogy minimalizálja érzékeny testszövetek sérülését.

A kutatók kitalálták, milyen hőre lágyuló elasztomerekre alkalmazható az eljárás. Eredeti tulajdonságainak megtartása volt a legfontosabb szempont, ezt az anyag legfőbb jellemzői alapján számolták ki, és végül sikerült megvalósítaniuk az elképzeléseket.

A mikrométer léptékű rostokban csatornák alakíthatók ki, és robotikus jellemzők dolgozhatók beléjük – képalkotó és stimuláló megoldások, elektródák stb.

Ezek a funkcionális elemek nyitják meg a kapukat a rostalakú autonóm robotok felé.  A gépecskék érzékelik a fényt, és „látnak” is, detektálják és elkerülik az út, például a gyógyszer a szervezet megfelelő pontjára való eljuttatása közbeni akadályokat, megtalálják rendeltetési helyüket. Működésükben kritikus jelentőségű a komplex irányító algoritmus.

A kutatók elmondták, hogy az elasztomer rostokba más anyagok is beágyazhatók, és meglepően egyszerű az előállításuk. Egy éjszaka alatt akár többszáz kilométer készíthető belőlük.

A rostalapú puha robotok távirányított katéterek mellett – és az emberi testen kívül – sok területen alkalmazhatók: az alvás minőségét figyelő matracoknál, önvezérlő ipari szerkezeteknél, hő- és tapintásérzékelőkkel felszerelt gépeknél, látórendszereknél stb.

Miért tanítják a mesterséges intelligenciát, hogy Minecraftot játsszon?

A 2009-ben indult, 2014 óta a Microsofthoz tartozó, népszerű Minecraft nyílt világú játék. A résztvevők blokkokból álló, pixeles 3D univerzumban fedezik fel annak nyersanyagait, eszközöket hozhatnak létre, építkezhetnek, és a játékmód függvényében ellenségekkel harcolhatnak, vagy együttműködhetnek másokkal. Játszható túlélő, kreatív és szemlélő módban is, Java-alapú kiadásában pedig új játékmechanikákkal, tárgyakkal és grafikával egészíthető ki. Előszeretettel használják az oktatásban, de infokommunikációs és más kutatásfejlesztésekhez is gyakran alkalmazzák.

Például mesterséges intelligenciákat tanítanak, pallérozzák gépi értelmüket a jellegzetes pixelvilágban.

A világhírű San Franciscói OpenAI (amelynek alapításában Elon Musk is részt vett) nemrég alkotta meg a földkerekség legfejlettebb Minecraftot játszó botját. Új gyakorlási módszerrel hetvenezer óra emberi játékot elemzett, és tanulta meg, hogyan alkosson pixeles szerszámokat, húzzon fel épületeket.

minrcraft.jpg

De ez csak a kezdet, mert a fejlesztők elmondták, hogy MI-jük idővel csúcstechnológiás megoldásokban, például valódi önvezető járművekben, atomerőművek és korlátlan mennyiségű megújuló energiaforrás működtetésében, kezelésében tölthet be fontos szerepet.

Az MI a Minecraftban „gyémánt-szerszámok” készítésére alkalmas első bot. Egy embernek huszonnégyezer egymást követő cselekvés és kb. húsz perc kell ugyanehhez. A bot esetében egyrészt utánzásos tanulást használtak, azaz az MI az óhajtott output megvalósítása érdekében, többezer emberi inputot figyelt, és javított rajtuk. A bot kialakításához egy másik népszerű és hatékony módszert, a próba-hiba alapú megerősítéses tanulást is alkalmazták.

Az utánzásos tanulással eddig az volt a legnagyobb gond, hogy a kutatóknak lépésről lépésre, manuálisan kellett címkézniük, és rengeteg idő elment vele. Az OpenAI teljesen szeparált, a címkézési folyamatot elvégző idegháló fejlesztésével oldotta meg a problémát. Előtte alkalmi gamerekkel játszattak kétezer óra Minecraftot, és felvették, hogyan érintik meg a billentyűzetet, egeret stb. Az MI ezeken az adatokon tanult, ez volt a „videó-előtanulás” (VPT).

A VPT-t is használva, a bot most már képes gépek számára korábban elképzelhetetlen dolgok létrehozására. Ez azért lehetséges, mert elődeit kizárólag megerősítéses tanulással trenírozták, és csak 970 lépéses folyamatokat abszolváltak. Az új MI azért boldogul el húszezernél több lépéssel is, mert fejlesztői a két tanulási stratégiát összekombinálták a gyakoroltatáshoz.

süti beállítások módosítása