Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Állandóan változó virtuális játékkörnyezetben tanulnak az MI-k

2021. szeptember 28. - ferenck

A Google-hoz tartozó mesterségesintelligencia-fejlesztő londoni DeepMind cukorka színű virtuális játszóteret fejlesztett MI-k tanítására. A videojátékokra emlékeztető XLand 3D világban állandóan változó feladatokat megoldva kell általános képességekre szert tenniük.

Speciális feladat abszolválásához szükséges egyedi képességek megszerzése helyett, a közeget színeken keresztül érzékelő mesterséges intelligenciák kísérletezni és felfedezni tanulnak, és közben korábban soha nem látott tevékenységekhez fontos adottságokra tesznek szert.

deepmind_3.jpg

Ez egy lépés az általános mesterséges intelligencia (AGI, artificial general intelligence) felé.

A világot központi MI kezeli, a környezet megváltoztatásával ő határozza meg a többmilliárd különböző feladatot, a szabályokat és a játékosok számát. Ő és a többiek is megerősítéses tanulást és próba-hiba (trial and error) módszert használnak.

deepmind0_2.jpg

Gyakorlás közben, először egyszemélyes játékokkal szembesülnek, például bíborszínű kockát kell sárga labdára vagy vörös padlóra tenniük. Később több-résztvevős játékokig fejlődnek, amelyekben, mondjuk, zászlót kell elrejteniük, megtalálniuk, versengeniük, hogy ki lesz az első. A játszótér-menedzsernek nincsenek speciális céljai, a játékosok általános képességeit akarja folyamatosan javítani.

A DeepMind korábbi MI-jei, például a sakkban és góban remeklő AlphaZero egyszerre csak egy játékot tudtak megtanulni. Úgy képzeljük el, hogy sakkról góra váltva, sakk-agyukat go-agyra cserélik. Az XLand ennek az állapotnak akar véget vetni, ezért van szükség több feladat szimultán elvégzésére, azokhoz könnyen adoptálható általános képességekre.

Speciális cél nélküli, nyílt tanulással az MI-k elvileg elérhetik ezt a szintet. A Homo sapiens és sok állat is így, céltalanul játszva tanul. Mesterséges intelligenciák esetében viszont nagymennyiségű adat kell hozzá, amelyet – a végtelen feladathalmazok formájában – az XLand automatikusan generál nekik.

Egyes MI-k legalább négyezer virtuális világon, 700 ezernél több, különféle játékon, 3,4 millió egyedi feladaton vannak túl. A helyzetenkénti legjobb lépés helyett addig kísérleteznek, amíg el nem jutnak a megoldásig.

Észak-nigériai tinilányok robotikát tanulnak

Az észak-nigériai Kano városában tizenéves lányok egy innovatív projekt keretében robotikát, számítástudományt és más STEM (természettudomány, technológia, mérnöki tudomány, matematika) témákat tanulnak. Már a témák kihívásnak számítanak, és nehezen egyeztethetők össze a helyi szokásokkal, a nőkkel szembeni elvárásokkal, a konzervatív muszlim társadalommal.

Egy olyan közegben, ahol a lányokat nagyon fiatalon kiházasítják, oktatásuk rövid ideig tart, ahol december óta ezernél több diákot raboltak el zsarolási szándékkal, és ezért sok szülő inkább nem járatja iskolába a gyerekeit, a Kabara civil szervezet (NGO) eltökélt szándéka a diákok világképének gépépítéssel, programozással, matematikával és a természettudományokkal való bővítése. A lányok élvezik a robotokat, a szoftvereket, kreatív használatukat, az alkotótevékenységet.

eszaknigeria.jpg

A Kabara Hadiza Garbati mérnök szellemgyermeke. A szervezet sanyarú helyzetű észak-nigériai gyermekeken akar segíteni, kihozni a bennük szunnyadó és a hagyományos oktatás által nem érintett képességeket, elősegíteni, hogy a jövőben vagy kisvállalatokat alapítsanak, vagy egyetemi tanulmányokat folytassanak.

A kanoi programot 2016-ban kezdték, azóta több mint kétszáz lány oktatásában segédkeztek. Garbati most már más északi városokban is hasonló projekteket tervez indítani. Kano szerencsére biztonságos környék, nem érinti az északi területeket sújtó terroristahullám.

eszaknigeria0.jpg

Garbati elmondta, hogy sikerült megtörnie egyes szülők ellenállását, és meggyőzte őket: a Kabara tiszteletben tartja az iszlámot. A projektet egyébként a helyi közösség szemében morális autoritásnak számító kanoi emír közvetlen tanácsadója, Nasiru Wada is támogatja.

„Főként azért segítjük, mert azt szeretnénk, hogy legyenek nyitottabbak. A hagyományok ugyan nem bátortalanítják el a lánygyerekeket, de az oktatásukra sem fektetnek elég hangsúlyt. Fontos, hogy ne csak humán tárgyakat, hanem természettudományokat is tanuljanak. Egészségügyi dolgozókra, informatikatanárokra is szükségünk van” – magyarázza Wada, majd hozzátette, hogy házas nőknek is fontos ezeknek az ismereteknek a megszerzése.

Kvantumszoftver hagyományos számítógépen

A Columbia Egyetem és a Lausanne-i Svájci Szövetségi Technológiai Intézet (EPFL) két kutatója rájött, hogyan működtethető bonyolult kvantumszámításokat végző algoritmus kvantumszámítógép helyett hagyományos komputereken.

A szóban forgó kvantumszoftver, a kvantummegközelítő optimalizálási algoritmus (QAOA) a lehetséges problémamegoldások közül a legjobbat kiválasztó, klasszikus matematikai optimalizáló feladatokat old meg.

A többek között a Google által is támogatott QAOA rendeltetése, hogy segítsen a kvantumgyorsulás, a feldolgozási sebesség előrejelzett, kvantumszámítógépen kivitelezhető, hagyományoson megvalósíthatatlan felpörgetésében.

kvantumszoftver.jpg

A kvantumgyorsulás korlátja azonban – részben az egyre eredményesebb klasszikus algoritmusok miatt – folyamatosan változik.

Rendelkeznek-e komoly előnnyel a mostani és a közeljövő kvantumszámítógépein futó algoritmusok praktikus feladatok megoldásában? – tette fel a kérdést a két kutató.

A válaszhoz először szimulált kvantumrendszerben kell megérteni a hagyományos számítások korlátait. Ez azért fontos, mert a kvantumprocesszorok mostani generációja olyan üzemmódban fut, hogy kvantumszoftverek működése közben hibák csúsznak be, és ezért csak korlátozott komplexitású algoritmusok futtathatók.

A javasolt megoldás a következő: a kvantumalgoritmusok egy – alacsony energiahasználattal működő – csoportjának a viselkedését szimuláló módszert dolgoztak ki hagyományos komputerekhez. A QAOA a csoport reprezentatív példája. A megoldás a gépitanulás-eszközökön alapul, hogy képesek megtanulni és utánozni kvantumszámítógépek belső működését. A QAOA-t mesterséges ideghálóval szimulálták, az eredménnyel kifejezetten elégedettek, új viszonyítási alap lehet jövőbeli kvantumhardver-fejlesztésekhez.

A lényeg, hogy a kvantumszámításokban szép jövő előtt álló QAOA nagyon pontosan szimulálható klasszikus komputereken. De ez sajnos nem vonatkozik minden kvantumalgoritmusra.

CLIP Art: humán művészek és mesterséges ideghálók együttműködése

Képzőművészet és mesterséges intelligencia románca nem újkeletű, és az utóbbi idők eseményei, fejlesztései alapján egyértelmű, hogy a trend folytatódik, a szó szoros értelmében is mélyül az együttműködés. Kreatív mérnökök ugyanis egyre több mélytanulás (deep learning) rendszerrel ismertetik meg a művészeteket, a rendszerek összekombinálása pedig szintlépéshez vezethet.

Kutatók, hackerek és művészek legújabban az előre begyakoroltatott (az OpenAI által fejlesztett) CLIP képosztályozó és generatív ellenséges hálózatok (generative adversarial network, GAN) együttes használatával készítenek alkotásokat.

clipart.jpg

A CLIP-nek – az OpenAI januárban tette közkinccsé a kódját – szöveges listát adunk azokról a képosztályokról, amelyeket szeretnénk, ha felismerne. A modell a legvalószínűbb csoportokat hozza ki eredményként.

Művészek szintén szöveges leírást adnak neki arról, hogy hogyan képzelik el alkotásukat. CLIP-nek a szöveget képekhez társító adottságát kihasználva, irányítanak GAN-okat.

clipart1.jpg

Egy kaliforniai művészközösség közreműködésével a Google létrehozta a CLIP-et különféle GAN-okkal összekötő Collab Notebooks rendszert. A felhasználó begépel egy mondatot, megad néhány paramétert, és kiválaszt egy GAN-t.

Mihelyst a GAN generált egy képet, CLIP pontozza, hogy mennyire kapcsolódik az eredeti mondathoz. A Collab-kód folyamatos iterációkkal addig javít a GAN hiperparaméterein, amíg a kimenet magasabb pontszámot ér el. A képgenerálás és a javítás ciklusa pedig addig ismétlődik, amíg az eredmény megegyezik a felhasználó által megadott küszöbértékkel, vagy esetleg jobb annál.

clipart2.jpg

A különböző GAN-ok különböző módon kezelik a vizuális karakterjegyeket. A BigGAN például az impresszionistább, a VQ-GAN a kubistább stílust részesíti előnyben. Egy-egy nagyon speciális, mondjuk, valamilyen játékra utaló kifejezés megadásával drasztikusan javulhat a képminőség.

A CLIP-et osztályozásra és nem társalkotásra, míg a GAN-okat ismert képek változatainak elkészítésére találták ki. Összetársításuk megmutatja, kreatív impulzusokra milyen művészi eredményekre képesek. Valószínűleg fejlesztőiket is meglepik velük. 

clipart3.jpg

A következő lépés vajon az lesz, hogy egy mesterséges idegháló adja meg az általa elképzelt alkotás paramétereit egy másik mesterséges ideghálónak, majd az utóbbi egy harmadikkal közösen megalkotja az eredeti ötletnél sokkal jobb és kifejezőbb képet?

Amerikai kutatók megzenésítették a hálózati adatforgalmat

Cyberbiztonsági szakértőknek elképesztő adatmennyiséget kell kezelniük. Legnehezebb dolguk akkor van, ha a hálózati forgalmat kell folyamatosan figyelniük.

Ha egyetlen nap adatforgalmát szövegformában kinyomtatnák, vastag telefonkönyv lenne az eredmény. Mit jelent ez? Például azt, hogy a rendellenességek észlelése kb. akkora feladat, mint tűt keresni a szénakazalban.

„Adatóceán. Látnunk kellene a fontos mintázatokat, de azokat átlagos vagy teljesen triviális minták temetik magukba” – érzékelteti a helyzetet Yang Cai, a Carnegie Mellon Egyetem (CMU) kutatója.

cylab.jpg

Cai évek óta szokatlan hálózati jelenségeket kimutató módszereken dolgozik. Kutatócsoportjával fejlesztett már forgalmi mintázatokat vizuálisan megjelenítő eszközt, most pedig az „anomáliákat” hangokba öntő, hallhatóvá tevő technikát találtak ki.

Megzenésítették a cyberbiztonságot.

„Normális és abnormális mintázatokat akartunk zeneileg megfogalmazni. A szonifikáció nem új, de az már az, hogy az adatokat így tesszük kellemessé az emberi fül számára” – magyarázza.

Több „hangtérképező” algoritmussal dolgozva, számszerűsített adatsorokat alakítottak át változatos melódiájú, harmóniájú, ütemű és tempójú muzsikává. Hangtájképeket dolgoztak ki, hogy a számokat zenei szerkezeteken belül is lehessen hallani. A 0 és 9 közötti számokhoz egyedi hangjegyeket társítottak, a Pi matematikai állandó (3,14159265359) harmadik és negyedik számjegyének (1 és 4) megjelenítéséhez például az ütemeket módosították 4/4-re és 1/4-re, és így tovább.

A műveletek ugyan bonyolultak, de a zenei változások mindenféle muzikális tanulmány nélkül jól hallhatók. Alapanyagként egy elosztott malware-hálózat adatforgalmát használták, nem zeneértő hallgatóságuknak különböző hangszereken adták elő, és egyből észlelték a változásokat.

„Nemcsak zenét készítünk, hanem elvont adatokat az ember által feldolgozható valamivé alakítjuk át” – nyilatkozta Cai és két kollégája. Ő nem, de munkatársai képzett zenészek is.

Cai szerint a jövő virtuálisvalóság-szemüveges elemzői nemcsak audiovizuálisan, hanem az összes érzékszervükkel észlelik a hálózati adatfolyamot. Minél közelebb mennek egy adatponthoz, adatklaszterhez, annál hallhatóbb lesz a zene.

Nem ott lőttek, ahol az MI hallotta

Az Egyesült Államok több mint száz városában, megyéjében használják a ShotSpotter cég azonos nevű, mesterségesintelligencia-alapú rendszerét. A rendszer hang alapján észleli a lövöldézést, majd háromszögeléssel azonosítják a helyszínt. A cég elemzéseire eddig 190 bűnügyben próbáltak támaszkodni.

Nagy felzúdulást keltett, amikor a Vice arról számolt be, hogy egyes esetekben megváltoztatták az eredményeket. Vagy az derült ki, hogy nem is lövöldöztek, vagy az, hogy nem ott történt, és a cégen belül módosítottak a helyszínen.

shotspotter.jpg

A ShotSpotter tavaly például petárdázást észlelt egy chicagói gyilkosság helyszínétől közel két kilométerre. Elemzői később megállapították, hogy nem petárda, hanem lövöldözés volt, a helyszínt pedig közelebb vitték a bűnügyéhez. Miután a védelem a rendszer törvényszéki értékének kivizsgálását kérte a bírótól, az ügyész visszavonta a ShotSpotter által szolgáltatott bizonyítékot.

2018-ban, szintén Chicagóban, rendőrök lelőttek egy személyt, és a rendszer csak két lövést, az övékét vette fel. A hatóságok az adatok manuális újravizsgálatát kérték a cégtől. Az elemzők ezúttal további öt lövést hallottak, valószínűleg a lelőtt személy lehetett.

shotspotter0.jpg

Más esetben, miután a rendőrség megkereste őket, az algoritmus szerinti helikopterzajt lövöldözésre változtatták. A bíró a ShotSpotter bizonyítékának megbízhatatlanságára hivatkozva, nem fogadta el a vádlott fegyverhasználatát alátámasztó bizonyítékot.

A ShotSpotter cég szerint a Vice beszámolója hamis és félrevezető. A rendszer által szolgáltatott adatok megváltoztatását ugyan nem tagadták, viszont szerintük az újságíró összekevert két különböző szolgáltatást: a lövések valósidejű detektálását és a cég által végzett későbbi elemzést. Törvényszéki elemzésekhez a valósidejű figyelmeztetés mellé további információk kellenek. Nem változtattak a rendszeren azért, hogy segítsenek a rendőrségnek – állítják.

A MacArthur Igazságügyi Központ, egy közérdekű nonprofit jogi csoport megállapította, hogy a ShotSpotter figyelmeztetését követő rendőri akciók túlnyomó többségében nem tudták bizonyítani a bűntényt. Miután kiderült, hogy a rendszer azonosításainak kb. a fele pontatlan, több város felmondta a céggel kötött szerződést.

Semmi rossz nincs abban, ha emberek elemzik és időnként módosítják MI-rendszerek outputjait. Az ember nem véletlenül része ezeknek a rendszereknek. Viszont nagyon fontos, hogy átlátható, ellenőrizhető módon működjenek, és az esetleges változtatásoknak technikai okai legyenek. Ha nincs így, erodálódik a beléjük, és az őket használó intézményekbe, például a rendőrségbe vetett bizalom.

Hogyan védjük ki a nyelvfeldolgozó alkalmazások elleni támadásokat?

A levélszemét-szűrők és a kamuhíreket észlelő technológiák hiába egyre kifinomultabbak, a támadók tartják, sőt fokozzák a tempót, módszereik folyamatosan javulnak.

Ezek egyike a hevenyészett magyarsággal egyetemes programindítónak fordítható, tanulásalapú universal trigger. Lényege, hogy a hacker egy szóval vagy kifejezésekkel sok inputot átver, „triggerel.” A sikeres támadás miatt még több a kamuhír, ömlik ránk a spam.

A Pennsylvaniai Állami Egyetem kutatói a természetesnyelv-feldolgozó alkalmazások ellen indított támadásokkal szemben 99 százalékos védelmet nyújtó gépitanulás-alapú modellt fejlesztettek. A DARCY nevű rendszer a cyberbiztonságból ismert „mézes bödön” (honeypot) elven nyugszik: a bödön az eredeti számítási környezetnek tűnik, pedig nem az, hanem csak az utánzata, csali a támadónak, jelen esetben az általa megcélzott szavakkal, kifejezésekkel vonzza magához a hackereket.

hack.jpg

„Próbálnak rájönni az egyetemes támadószavakra, mi pedig vonzóvá tesszük számukra a környezetet, hogy kikössenek az általunk már beállított szavaknál. Azt hiszik, milyen könnyű dolguk van, és besétálnak a csapdába” – magyarázza a fejlesztést vezető Thai Le.

DARCY több csalit keres és rak be egy szövegalapú ideghálóba, amely aztán kiszedi, kiszűri az egyetemes programindító támadással generált rosszindulatú tartalmat.

Ez az első eset, amikor a „mézes bödönt” szöveges ideghálók védelmére használják. Míg a mostani védelmi módszerek reaktívak, támadás után figyelik meg, tanulják ki a hacker technikáit, és várnak a következő attakra, addig a DARCY proaktív, megelőzi a rosszfiúkat. A modell nem gyakorlás után, hanem közben védekezik.

Négyféle szövegosztályozó adatsoron, hat potenciális támadási forgatókönyvben tesztelték. Öt detektáló algoritmussal hasonlították össze, és sokkal jobban teljesített náluk. A 99 százalékos azonosítás mellett, a hamis pozitívok aránya elenyésző, mindössze 2 százalék volt. Ez utóbbi szám szintén nagyon komoly előrelépés.

A sikert látva, a kutatók bizakodnak, hogy technikájuk a természetesnyelv-feldolgozáson kívüli területeken is alkalmazható.

Mesterséges intelligencia segít megérteni a Napot

Az égitest folyamatos megfigyelése a részecskék és az intenzív fény véget nem érő áramlása miatt nehéz és komoly károkkal jár a napteleszkópok munkája. A műszer érzékeny lencséi és szenzorai fokozatosan elromlanak.

Tudósok időnként újrakalibrálják a teleszkópokat, hogy lássák, mennyit gyengültek, illetve, hogy az általuk küldött adatok pontosak maradjanak.

nap1.jpg

A NASA 2010-ben indított SDO (Solar Dynamics Observatory) rendszere egy évtizeden keresztül remek és részletes képeket szolgáltatott a Napról. Tudósok ezek alapján próbálják megérteni az égitest hatását a világűr időjárására, más bolygókra, űrhajósokra stb.

Az SDO két képalkotó műszerének egyike, az AIA (Atmospheric Imagery Assembly) tizenkét másodpercenként készít képeket tíz hullámhosszú ultraibolya fény mellett. Sehonnan nem szerzünk ennyi információt a Napról, de az információszerzésnek ára van: az AIA romlik, gyakran kell kalibrálni.

nap.jpg

Ezt rövid, kb. tizenöt perces űrrepüléssel, néhány műszerrel a fedélzetükön, kisebb szondázó rakéták szokták megoldani. A Föld atmoszférája felett repülve, a műszerek látják az AIA által mért ibolyán túli hullámhosszokat – amelyeket az atmoszféra elnyel, és ezért nem mérhetők a Földről.

Az AIA kalibrálásához ultraibolya teleszkópot kapcsolnak a rakétához, az hasonlítja össze a saját és az AIA adatait. A tudósok ezt követően mérhetik fel, korrigálhatják az AIA méréseit.

nap0.jpg

A módszernek azonban megvannak a hátulütői. Mivel a rakéták nincsenek állandóan az űrben, két rakéta tevékenysége között elcsúszik a kalibrálás, ami űrmissziókon egyébként sem lehetséges.

A NASA kutatói eldöntötték, hogy a konstans kalibráláshoz más lehetőségeket keresnek, és eljutottak a gépi tanulásig. Az algoritmus megtanulta felismerni a napszerkezeteket, és hogy hogyan hasonlítsa össze őket az AIA adataival. A rakéták kalibrációs repüléseiről kapott képekből tanult. Ha elég adata van, elsajátítja, hogyan kell képről képre kalibrálnia.

Mivel az AIA többféle hullámhosszon nézi a Napot, az algoritmus speciális szerkezeteket összehasonlítva, megerősítheti a tudósok feltételezéseit. Ehhez persze azt is meg kellett tanulnia, hogyan néznek ki ezek a szerkezetek, milyen egy napkitörés stb.

Az MI és a rakéták adatait összehasonlítva, kiderült, hogy a virtuális kalibrálás ugyanolyan jól működik, mint a valódi, ráadásul folyamatosan, megszakítás nélkül végezhető, tehát javul az adatminőség.

A NASA egy másik kutatócsoportja a Föld mágneses mezeje és az ionoszféra kapcsolatát tanulmányozza mesterséges intelligenciával. Új módszerrel vizsgálják, és jobban értik az energiával töltött részecskék mozgását az atmoszférában, hatásukat a világűr időjárására.

A gépi tanulás gyors fejlődésével egyre több űrkutatási alkalmazás várható.

Jönnek az újfajta memóriák?

Amerikai és francia kutatók speciális eljárást dolgoztak ki újfajta memóriákhoz. Munkájukkal a mesterségesintelligencia-fejlesztéseket kívánják felgyorsítani.

„Kvantumanyagokkal jelentősen javíthatók a számítógépek lehetőségei. Ezeknek az anyagoknak a tulajdonságaira alapozva, fejlesztettünk egy új számítási eszközt” – magyarázza Andrew Kent, a New York Egyetem fizikusa.

Mivel a hagyományos számítástudomány elérte lehetőségei határát, a területet forradalmasító és egyszer talán az emberi aggyal versengő új módszereket és eszközöket kell fejleszteni – vélik a kutatók.

informaciotarolas0.jpg

Az emberi agy működését utánozni hivatott neuromorfikus számítások az utóbbi években komoly fejlődésen mentek keresztül. Emberszerű tulajdonságaik miatt, a mostani számítási módszerekkel kivitelezhetetlen eljárásokkal hatékonyabbá tehetik az adatfeldolgozást.

A kutatócsoport különleges eszközt – nanodimenzióban, kvantumhatásokkal működő rezonátort – fejlesztett, amellyel innovatív módon változtathatók meg fizikai tulajdonságok.

A rezonátorok, egy kicsit a vonós hangszerek „dobozához” hasonlóan, képesek pontosan meghatározott frekvenciahullámokat generálni, tárolni. Az új rezonátor az emberi agy idegsejtjeinek és szinapszisainak mintájára tárolja és dolgozza fel az információt. Különlegessége, hogy spintronikus mágneses eszközökkel kombinálja össze a kvantumanyagok egyedi tulajdonságait.

A spin és az elektronika szavakat összevonó spintronika abból indul ki, hogy az elektron, elektromos töltés mellett, spinnel is rendelkezik. (A kvantummechanikában a spin a részecskék saját, belső perdülete, vagy impulzusmomentuma, lényegében a részecske tulajdonságait leíró hullám- vagy állapotfüggvény.)

A spintronikán alapuló eszközök a spin és az elektromos töltés kombinációjával úgy kezelik az információt, hogy – a hagyományosabb technikákkal ellentétben – a tároló- és a feldolgozókapacitás növekedése mellett, csökken az energiafelhasználás.

Ezek az eszközök speciális frekvencián működnek. Ha kvantumanyagokat adunk hozzájuk, a frekvencia finomhangolható, használhatóbb lesz, nőnek az alkalmazási lehetőségek.

Kent szerint a számítástudomány, különösen a neuromorfikus számítások további fejlődése szempontjából kulcsfontosságú lépésről van szó. Az ilyen rezonátorok számítási eszközök komponenseit kapcsolhatják össze.

Magukat tanítják az önvezető autók

Az önvezető autókat hatalmas mennyiségű adattal dolgozó gépitanulás-algoritmusok működtetik. Ha viszont képesek lennének úgy tanulni, mint a csecsemők a járást, azaz a környezetükben tartózkodók megfigyelésével és utánzásával, akkor jóval kevesebb közlekedési adatot kellene összegyűjteni.

Eshed Ohn-Bar, a Boston Egyetem kutatója és Jimuyang Zhang, a felsőoktatási intézmény PhD-hallgatója ebből a gondolatból kiindulva, teljesen új módszert dolgoztak ki az önvezető autók tanulására. A jármű más járműveket figyel az úton, az algoritmus előrejelzi a környezetre adott reakcióikat, és a rendszer ezen információk alapján hozza meg a saját döntéseit. Így tanulja meg a biztonságos vezetést.

Elképzelésüket saját kutatási területük helyzete is inspirálta – a fejlesztésben érintett nagyvállalatok rengeteg, az önvezető autók tanulásához szükséges adattal rendelkeznek, viszont – megakadályozva a versenyt – azokat meg is tartják maguknak. Közben a kutatóközösségen belül egyre nő az adatmegosztás és az együttműködés iránti igény.

selfteaching.jpg

Mindegyik cég ugyanazt az utat járja be: szenzorokat pakolnak az autóba, irányításukhoz vezetőket fizetnek meg, adatokat gyűjtenek, majd a járművet vezetni tanítják. Ha az adatokat megosztanák, hamarabb fejlesztenének biztonságos önvezető autókat, a társadalom szélesebb rétegei profitálnának belőlük. Akkora adatmennyiségről van szó, hogy a problémát egyetlen cég sem oldja meg egyedül – érvel Ohn-Bar.

„Hiába van többmilliárd kilométernyi adat, a valóság annyira változatos, hogy ezek csak vízcseppek az óceánban. Egy hiányzó információminta viszont már önmagában is kockázatos vezetést, potenciális karambolokat okoz” – magyarázza.

Algoritmusuk felbecsüli a közeli autók nézőpontjait és vakfoltjait, majd madártávlati térlépet készít a környezetről. A térkép segítségével a jármű észleli az akadályokat, más autókat és gyalogosokat, megérti, miért változtat irányt, fékez stb. a többi. Kommunikál velük, összeütközés nélkül engedi előre, előzi meg őket.

Az autó az akár ember vezette, akár szintén önvezető többi jármű cselekedeteit referenciakeretekké alakítja át. Mivel a megfigyelés kulcsfontosságú, az adatmegosztás is az.

A kutatók két virtuális településen tesztelték a „nézz és tanulj” algoritmust. A terepek hiába különböztek egymástól, az idegháló nagyon kevés ütközéssel megúszta. Az esetek 92 százalékában ért célba. Míg a korábbi legjobb módszerekhez több órányi vezetési adat kellett, az övékéhez tíz perc elég volt.

A bíztató teszteredmények ellenére, nagyon sok kihívást kell még kezelniük: a megfigyelt járművek drasztikusan változó perspektíváit, a szenzorok pontatlan méréseit, különféle vezetői stílusokat stb.

Ohn-Bar szerint módszerük más területeken, például szállító robotoknál, drónoknál is alkalmazható.

süti beállítások módosítása