Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

A Disney ideghálója tetszés szerint öregíti, fiatalítja színészek arcát

2022. december 07. - ferenck

A Csillagok háborúja és tévésorozatok számítógép által generált színészei után, a Disney színészek „vizuális” életkorát a képernyőn megváltoztató ideghálót fejlesztett. A technológiával lehetővé válik, hogy televíziósok és filmesek automatizált folyamattal megöregítsenek, megfiatalítsanak szereplőket. A megoldás olcsóbb és kevésbé időigényes, mint az ugyanezt célzó korábbi eljárások.

Eddig 3D szkenneléssel és modellezéssel, 2D-s képkockáról képkockára haladva, a Photoshophoz hasonló eszközökkel végeztek arcokon digitális retusálást. A munka hátulütője, hogy a film hosszától függően, hetekig vagy tovább is eltarthatott.

reageing.jpg

A Disney mesterségesintelligencia-alapú „arcot újra-öregítő hálózata” (FRAN) automatizálja ezt a folyamatot. A nagyvállalat állítása szerint ez az első praktikus, teljesen automatizált, gyártásra kész módszer videóképeken látható arcok életkorának módosítására.

A kutatók véletlenszerűen többezer 18 és 85 év közötti, szintetikusan módosított életkorú képet generáltak a StyleGAN2 ideghálóval. FRAN ezeken az adatokon gyakorolt, és tanulta meg, hogyan változik az idő előrehaladtával egy személy külseje. A tanulást követően, az „öregedési elveket” képkockáról képkockára haladva, tudja mozgásban lévő valódi színészekre alkalmazni.

A felügyelet melletti tanulás során ugyanannak a szintetikus és fotorealisztikus személynek az arckép-párjaival dolgozott. A párokat a kapcsolódó forrás és a cél-életkor megadásával címkézték fel. Mivel a gyakorlóadatokat szintetikusan hozták létre, elkerülték a „lehetetlent”, nem kellett sokféle identitású, életkorú és etnikumú személy, különböző nézőpontokból megörökített képeit összegyűjteniük.

A Disney valódi filmekben és televíziós műsorokban használható, kiváló minőségű outputot ért „gyártásra kész” megoldáson. Elmondásuk alapján a változatos arckifejezések ellenére, ez az első színészek életkorát a mozgókép-anyagon dinamikusan megváltoztatni képes mesterségesintelligencia-alapú technológia.

A rendszerhez felhasználóbarát interfészt is fejlesztettek, amellyel az alkotók könnyen tudják kezelni az ideghálót.

A Boston Dynamics bepereli az egyik versenytársát

Egyre kíméletlenebb a verseny a robotkutya-piacon.

A terület élenjárójának számító – és a Hyundai tulajdonában lévő – Boston Dynamics bepereli a katonai hardvereken dolgozó Ghost Robotics-t, mert szerintük a 2019-ben bemutatott, négylábú és emblematikus Spot szerkezetükre vonatkozó hét szabadalmat sértettek meg: a másik vállalat Spirit 40 és Vision 60 gépeivel (lásd 2. és 3. kép) – így a Boston Dynamics – az ő kulcstechnológiáikat, például az önkorrekció és a lépcsőjárás mechanizmusait „kölcsönözte.”

boston_dynamics_1.jpg

Először 2020 júliusában, négy hónnappal a Spirit 40 bemutatását követően, figyelmeztették, hogy nézzék át a Spothoz kapcsolódó szabadalmakat, majd két levélben a robotkutyák forgalmazásának abbahagyására szólították fel őket.

A Boston Dynamics elfogadja a versenyt, viszont itt a szellemi tulajdonjogaik megsértéséről és nem pontosított károkozásról van szó – hangsúlyozza a cég vezetősége.

boston_dynamics0_1.jpg

A pereskedés nem meglepő. A még mindig fiatal vállalatnak tekinthető Boston Dynamics eredetileg a kutatásfejlesztésre összpontosított, idővel viszont robotjai, például Spot és Stretch kereskedelmi forgalmazása is egyre fontosabbá vált. A riválisok, mint a Ghost Robotics komoly fenyegetést jelenthetnek számukra, és még ha nem is nyerik meg a pert, más cégeket eltántoríthatnak robotkutyák fejlesztésétől.

A Ghost Robotics szerint a vádak alaptalanok, a verseny elfojtására tett kísérletek.

boston_dynamics1.jpg

A Spirit 40-t egy évvel később követte a komoly sajtóvisszhangot kiváltó újabb robotkutya-iteráció, a Vision 60, amelyre mesterlövész-puskát is szereltek. A fegyveres gép már a „gyilkos robotok” kategóriájába tartozik, és ezzel több mesterségesintelligencia-kutató szerint a Ghost Robotics átlépte, a morális, jogi és technikai határokat, mert egy ilyen fegyver terroristák és úgynevezett latorállamok kezébe is kerülhet.

Egyelőre nem világos, hogy a robotkutya mennyi autonómiával rendelkezik, de nincs egyedül, mert az ember által irányított és autonóm drónok között több már most is képes gyilkolni. Szakértők sürgetik is a terület ENSZ általi szigorúbb szabályozását.

Mivel – leszámítva a fegyvert – a robotkutyák általában nagyon hasonlítanak egymásra, elkerülhetetlen volt, hogy előbb-utóbb elkezdődik a pereskedés.        

Figyelnek a hirdetőtáblák

Az elektronikus jelek elemzése, a gépi látás és a számítási felhő közös nevezőre hozásával a fizikai valóságban is megjelentek az online hirdetőiparban jól ismert gyakorlatok, mint például a reklámok személyre szabása, vagy a fogyasztók pontosabb targetálása.

A közterületen reklámozó cégek arcelemzéssel és személyes adatok felhasználásával igyekeznek elérni, hogy a potenciális nézők – és főként az érdeklődők – valósidőben lássák a hirdetéseket.

hirdetooszlop.jpg

Az intelligens jelekkel, táblákkal foglalkozó francia Quividi rendszere maximum száz arcot elemez egyszerre, azonosít nemet, életkort, hangulatot. Utóbbinál figyelembe veszi, hogy az illető merre néz, és mennyi ideig nézi a hirdetést.

A brit Ocean Outdoor reklámcég bevásárlóközpontokban és angol városok kereskedelmi negyedeiben alkalmazza a Quividi technológiáját. Az Emoji Movie-t promótáló hirdetése például a járókelők arcára kopírozott emojikat mutat. Egy másik az öngyilkosság kockázatára hívja fel a közfigyelmet – s rajta látható szomorú arcú lány mosolyogni kezd, amikor valamelyik járókelő éppen ránéz.

hirdetooszlop0.jpg

A floridai Alfi digitális kijelzőit a közeli személyek nemét és életkorát felbecsülő kamerákkal szerelték fel. Az információkat időjárási és időadatokkal kombinálva, választja ki a megjelenítendő hirdetést. A rendszert két brit bevásárlóközpont, brit és amerikai taxisok és a fuvardíjat az utasok között megosztó szolgáltatók (Lyft, Uber stb.) használják.

A texasi ClearChannel mintegy háromezer brit elektronikus hirdetőtábla és ezerkétszáz buszmegálló reklámjai körüli arcokat elemez. Több táblába beágyazták a német Adsquare fogyasztói csoportokat, például gyorsétterem-rajongókat, organikus ételek iránt érdeklődőket azonosító technológiáját. Utóbbiakat mobiltelefonos adatok (hely, demográfia, érdeklődés) alapján végzi, majd a rendszer eldönti, hogy milyen járókelő-csoportoknak milyen hirdetéseket mutat a tábla.

Ezek a cégek érzékeny területen, nyilvánosság és személyes tér (privacy) határmezsgyéjén egyensúlyoznak, a döntéseket – mikor ki mit lásson – mesterséges intelligencia hozza. Jogvédő szervezetek árgus szemekkel figyelik a tevékenységüket, de a reklámozók többször elmondták, hogy betartják az európai Általános Adatvédelmi Szabályozás (GDPR) követelményeit.

Művészek mesterséges intelligenciával készített utánzatok ellen

A mesterségesintelligencia-technológiák berobbantak a képalkotásba, 2022 az ilyen jellegű alkalmazások diadalmenete volt. A gépi képalkotással azonban lehetővé vált művészek stílusának utánzása, például teljesen élethű másolatok – hamisítványok – készítése is.

Miután a világhírű dél-koreai illusztrátor, Kim Jung Gi október elején elhunyt, egy nappal később egy korábbi játékfejlesztő közkinccsé tett a művész stílusában képeket alkotó modellt. Az ő képein tanult, gyakorolt. A fejlesztő Kim Jung Gi előtti tisztelgésről beszélt, a reakciók viszont nemcsak kritikusak voltak, vagy sértőnek tartották a modellt, hanem egyes kommentelők meg is fenyegették, erőszakra buzdítottak ellene.

dreamup0.jpg

A kommentek friss tendenciát, a mesterségesintelligencia-fejlesztés és a fejlesztők ellen keményedő retorikát szemléltetik. Másrészt, sok képzőművésznek sem tetszik, hogy képeiket MI-alapú programok, appok utánozhatják.

A DeviantArt – online közösség és digitális piac, ahol alkotók mutatják be és árusítják munkáikat – ellenlépésként elindította a DreamUp nevű, szövegből képet generáló programot, amellyel művészeknek kíván segíteni, hogy jogosultság nélkül ne utánozhassák a stílusukat, másolhassák munkáikat.

dreamup.jpg

A DreamUp a Müncheni Műszaki Egyetemen fejlesztett és egyre népszerűbb (szintén szövegből képet alkotó) Stable Diffusion app implementációja. Művészek kitölthetnek egy formulát, megadva a nevüket, álneveiket, alkotásaik címét. Az app felteszi mindet a blokkolt szöveges utasítások (prompts) listájára.

A DreamUp minden outputot MI által generált képként címkéz fel. A rendszer outputjait a DeviantArtra feltöltő felhasználóknak meg kell adniuk az adott munkájukra ható művész nevét, sőt, jelenthetik is a szerintük valakinek a stílusát utánzó képeket. Ha az eset nem egyértelmű, a DeviantArt az illető művészt kéri fel, hogy döntsön.

A DevianArt öt szabadon használható promptot kínál fel havonta. Ha 14,95 dollárért havonta előfizetünk rá, akkor  havi egy hónapban háromszázhoz juthatunk hozzá. Nem előfizetőknek egy prompt húsz cent.

A Stable Diffusiont egyébként a világhálóról, például a DeviantArt honlapjáról is összeszedett képeken gyakoroltatták. Közkinccsé tételekor több művész tiltakozott a modellben rejlő utánzási potenciál miatt, mert például arra is utasíthatjuk, hogy xy stílusában készítsen képet. Elég hozzá egy „in the style of xy” prompt is.

A világ legintelligensebb irodaháza

A távmunka terjedésével a munkahelyek fizikai tere is változik, és közben egyre több munkaadó próbálja például ingyenes étkezéssel, rugalmas munkaidővel és csúcstechnológiás megoldásokkal „helyben tartani” alkalmazottait.

Az intelligens épületek és városok koncepció nem új, gőzerővel dolgoznak a megvalósításán. A következő lépést egy szingapúri irodaház, az ötvenhektáros Punggol digitális negyedben álló JTC Summit vetíti előre.

szingapur.jpg

A harmincegy emeletes épület kívülről úgy néz ki, mint bármelyik más modern irodaház a világon. A „felszín alatt” viszont hálózatba rendezett hatvanezer szenzor működteti, s teszi majdnem élő organizmussá.

A városállam kormányának fejlesztési ága, a Govtech új keretet dolgozott ki az okos energiagazdálkodástól az épületműködtetésig, robotszolgáltatásokig, mindenféle technológiák egyetlen – middleware-ként funkcionáló – platformon (Open Digital Platform, OPD) való kezelésére. Maga az épület a Smart District OS-en (operációs rendszeren) keresztül kapcsolódik a platformhoz.(Az ODP és a Smart District OS a tervek szerint 2025-re Punggolban mindenhol működni fog, első körben 28 ezer új állást teremtve, ami csak a kezdet.)

szingapur1.jpg

A JTC Summit tulajdonosai az épület digitális ikrével, virtuális világbeli másolatával dolgoznak együtt, az teszi lehetővé a világítás optimalizálásától a hatékonyság növeléséig, mindenféle döntések meghozását. Az oprendszer minden összekapcsolt részt folyamatosan monitoroz, így a legapróbb részleteket is tudja a bejáratokról, liftekről, meghibásodásokról, hogy mikor mire kell alaposan figyelni.

A mozgások valósidőben a helyszínről és messziről is láthatók, a bejárat például távirányítva nyitható ki, ha megérkezett az ételfutár, a lift pedig éjszakára – energiatakarékossági céllal – leállítható. Ha a CCTC rendszer túlzsúfoltnak tart egy tárgyalót, vagy a külső hőmérséklet emelkedik, a rendszer automatikusan növel a légkondicionáláson. A mélygarázsban elektromosautó-töltők sorakoznak, és ha a kamerák füstöt érzékelnek, akkor azonnal automatikusan leáll a töltés.

Az épületben megnyerő külsejű robotok is dolgoznak: csomagokat visznek rendeltetési helyükre, karbantartásra figyelmeztető jeleket továbbítanak, vagy egyszerűen csak járőröznek, hátha valami rendelleneset találnak valahol. Az ő tevékenységük is valósidőben figyelhető.

A rendszer tevékenysége túlmutat az irodaházon: az adatokat kormányzati ügynökségekkel megosztva, repülőgépek érkezésére, a kikötőben dekkoló hajók állapotára vonatkozó, a biztonsági szerveknek fontos adatokat is gyűjthet. Figyeli a vízszintet, áradásokat, gyanús szennyeződéseket. Az infók alapján változatos szimulációkat futtathatnak le, és dönthetnek közlekedési változtatásokról, vagy hogy hova érdemes majdani buszmegállókat árnyékoló fákat ültetni.

Készen állunk a munkahelyi agyszkennelésre?

Sok főnök szeretné, ha beleláthatna alkalmazottai fejébe. Most viszont úgy tűnik, hogy ez nem sci-fi, hanem tényleg megvalósulhat.

Az utóbbi években több vállalat állt elő „elmeolvasó” technológiákkal, amelyekkel az alkalmazók megfigyelhetik a munkaerőt. Egy izraeli cég, az InnerEye az emberi elmével összekapcsolható, gépi tanulással felerősített headsetet fejlesztett. Elmondásuk alapján az eszköz a gyorsabb munkavégzésben és a döntéshozás bizonytalanságainak leküzdésében segíti a dolgozókat.

A San Franciscói Emotiv startup vezeték nélküli EEG-s (elektroenkefalográfos) headsetje az alkalmazottak mentális állapotát, állapotváltozásait képes hatékonyan követni. Az InnerEye („belső szem”) szerint „embereket és gépeket összekötve, technológiánk a két világ legjavát kombinálja egybe.”   

bossware.jpg

Sokan viszont – nem véletlenül – szkeptikusak ezekkel a megoldásokkal szemben, és joggal beszélnek disztópiáról. A fejlesztőcégek azonban nem törvényenkívüliek, virágzik a piac, a munkaadók egyre komolyabb összegeket kezdenek befektetni az elmefürkésző technikákba.

Az alapképlet ismerős: ilyen eszközökkel jelentősen növelhető a munka hatékonysága. Ha alkalmazásra kerülnek, véletlenül sem az alkalmazottakat figyelik meg, hanem a jólétüket, mentális állapotukat erősítik velük. Technikai értelemben lehet, hogy monitoring folyik, de „értük, és nem ellenük.”, például azért, hogy ne kelljen megerőltetni magukat a gyors döntéshozásban.

Míg az InnerEye a dolgozókat „szuperemberekké” változtatná, addig az Emotiv „csak” a boldogságukra figyel…

bossware1.jpg

„Tisztában vagyunk a technológia disztópikus lehetőségeivel. Éppen ezért tudatosan választjuk ki a partnereinket; csak olyan szervezeteket, amelyek felelősen vezetik be megoldásainkat, és az alkalmazottakat tényleg gazdagítani akarják velük” – jelentette ki Tan Le, az Emotif alapító-vezérigazgatója.

Az alkalmazottakra koncentráló marketingstratégia megkülönbözteti ezeket a technológiákat az alkalmazó megfigyelési lehetőségeit a távmunka által meghatározott világban is növelő termékektől, az úgynevezett bossware-től. A különbség hangsúlyozása viszont valószínűleg csak marketingfogás, mert az adatbányászattal és az elmeolvasó headsetekkel a személyes szféra is eredményesebben monitorozható, mint eddig.

Az Emotiv elmondta, hogy az EEG-adatok kizárólag az alkalmazottakat illetik meg, akik hozzájárulhatnak azok anonimizált formában történő másolásához, megosztásához.

De vajon akarják is ezeket a technikákat, és lehetőségükben áll-e egyáltalán, hogy ne az ilyen megoldások iránt élénken érdeklődő alkalmazók érdeke érvényesüljön?

Amerikai kutatók önmagukat építő robotokat építenek

Az MIT (Massachusetts Institute of Technology) Bitek és Atomok Központjának kutatói a többek között a NASA és az Egyesült Államok Hadseregének Kutatólaboratóriuma által finanszírozott ambiciózus projekten, magukat eredményesen összeszerelő robotokon dolgoznak. Elmondták, hogy még évekre vagyunk az autonóm „önépítő” robotoktól, az eddigi eredmények viszont bizakodásra adnak okot.

A rendszer központjában (a számítógépes grafikából kölcsönzött szóval) voxelek vannak, ezek az egységek szállítják a részek között megosztható energiát és az adatokat. A részek alkotják a robot alapját, további voxeleket „csípnek el” és kapcsolnak magukhoz, mielőtt azok – későbbi összeszerelés végett – áthaladnának a rácshálózaton.

mit_robot_1.jpg

A kutatók megkérdőjelezik azt az általánosan elfogadott álláspontot, mely szerint nagyobb szerkezetek építéséhez nagyobb gépek kellenek. Megközelítésük olyan területekre alkalmazható, ahol ma vagy komolyabb anyagi befektetések kellenek a létező és kötött infrastruktúrához, vagy egyelőre kivitelezhetetlenek az elképzelések.

E rendszerek megfelelő szintű intelligenciájának fejlesztése is akadályt jelent. A robotnak meg kell határoznia, hogyan és hol építsen új robotot, mikor kezdjen bele, hogyan kerülje el a többi robottal való ütközést.

A szerkezetek kiépítése során intelligenciát is beléjük kell ágyazni. Az egyik fejlesztő, Neil Gershenfeld szerint ezért döntöttek a „szerkezeti elektronika, az adatokat és az energiát, valamint az erőt továbbító voxelek” mellett.

Hardver-problémák is adódnak, és ezeket megoldandó, a kutatók a voxeleket egyben tartó erősebb konnektorokon dolgoznak jelenleg.

Ha elkészül, egy ilyen rendszerrel megspórolható a prototípuskészítésre fordított rengeteg idő.

„Miközben egyre nő a 3D nyomtatással készült házak iránti igény, ezekhez legalább akkora, vagy nagyobb printerek kellenek, mint az épület. Komoly haszna lehet, ha a szerkezeteket apró robotok szerelik össze. A munka iránt a DARPA (az USA Védelmi Minisztériumának Fejlett Védelmi Kutatási Projektek Ügynöksége) is érdeklődik, az erózió és a tengerszint növekedése miatt a partvédelmet erősítő lehetőséget lát benne” – írta egy sajtóközleményben az MIT.

Annyi az adat, hogy új mértékegységek kellettek

Egyre több digitális adatot hozunk létre és tárolunk, és a folyamatosan növekvő számokkal csak akkor tudjuk tartani a lépést, ha új mértékegységeket találunk ki.

Ennek az alapvetésnek a szellemében, a 27. Általános Súly- és Mértékkonferencián, november 19-én úgy döntöttek, hogy a Nemzetközi Mértékegységrendszert, a metrikus rendszert újabb előtagokkal egészítik ki, és mostantól a ronna (R) és a quetta (Q) a hivatalos elnevezés, ha az első számjegyet további huszonhét, illetve harminc nulla követi. Ezek a jelenlegi legnagyobb mértékek.

ronna.jpg

Ugyanez a miniatürizált világban is érvényes, csak természetesen visszafelé: ha huszonhét nulla van a tizedesvessző után, akkor ronto (r), ha harminc, akkor pedig quecto (q) az elnevezés. Ennél kisebb egyelőre nincs.

„A legtöbb ember megszokta a milli- előtagot, mint például a milligramm. A mostaniak viszont a valaha végzett legnagyobb és legkisebb mérések” – magyarázza Richard Brown, az Egyesült Királyság Nemzeti Fizikai Laboratóriuma metrológiai csoportjának vezetője.

Eddig a huszonnégy nullát jelölő yotta volt a csúcs, de most már a Föld tömegét is hat ronnagrammnak, és nem hatezer yottagrammnak mondjuk, míg a Napéra is jobban hangzik a kétezer quettagramm, mint a 2,000,000,000 yottagramm.

Szükség volt már ezekre az új mértékegységekre, mert a tudósok és a különféle iparágak egyre nehezebben tudják kezelni az eddig érvényes kategóriákkal leírt adatmennyiséget. A váltást elsősorban az adattudomány és a digitális tárolás növekvő követelményei indokolják, hogy a yotta- és zettabájt határokat meghaladó információmennyiséget is érthetően le tudják írni.

Az International Data Corporation piackutató csoport előrejelzése szerint a világ 175 zettabájt (huszonegy nulla) adatot fog generálni 2025-ig, míg a legkisebb méretet leíró ronto és quecto a kvantumtudományokban, a részecskefizikában és fizikai laboratóriumokban lesz nagyon hasznos, mert például az eddigi 0,001 yoctogramm helyett elég, ha csak egy rontogrammot mondunk.

1991 óta most változtattak először a mértékegységrendszeren. Brown szerint legfőbb ideje volt.

Kamukép-detektort fejlesztett az Intel

Az utóbbi években egyre több kamukép, kamuvideó (deepfakes) árasztotta el a világhálót. Lényegük, hogy készítőik egy képbe vagy videóba egy másik személynek az arcát, hangját majdnem tökéletes technológiával beillesztve, új, megtévesztő vizuális anyagot hoznak létre személyekről, eseményekről. Nagy valószínűséggel mindannyian belefutottunk már ilyen álló- és/vagy mozgóképeket tartalmazó anyagokba.

A Pew Kutatási Központ felmérése alapján az amerikai felnőtt lakosság 63 százalékát zavarta már össze aktuális témákban deepfake.

deepfake_3.jpg

A teljesen élethű arcvonásokat, hamisítványokat sok esetben félretájékoztatásra, hamis infók, álhírek terjesztésére, csalásra és egyesek (főként politikusok és más hírességek) megalázására, hírnevük rontására használják. Olyanokat tesznek ezek a celebek, amit soha nem szoktak, de léteznek egyébként soha nem élt személyekről készült teljesen hihető képek, videók is. Egyes anyagok túl erőszakosak, míg mások tovább növelik a lakosság médiumok iránti bizalmatlanságát.

A múltban magukat álláskeresőnek kiadó csalók kamuképekkel próbáltak vállalatok bizalmas adataihoz hozzáférkőzni. Mára gombamód szaporodott el a zavarosban halászó alkalmazások száma.

deepfake0_3.jpg

Készítésükhöz gépi tanuláson, mesterséges intelligencián alapuló módszereket alkalmaznak. A káros következmények, például – a videókon – kirekesztő beszédeket mondó politikusok ellehetetlenítése miatt egyre fontosabbá vált a deepfake anyagokat azonosító szoftverek, alkalmazások fejlesztése.

Az Intel bejelentette, hogy a deepfake-özön ellen harcolva, kamuvideókat – 96 százalékos pontossággal azonosító – technológiát (FakeCatcher) fejlesztett.

Munkáját valósidőben végzi, és abból indul ki, ami emberivé tesz minket, ezért a pixeleken is észlelhető vérkeringést figyeli. Képes az erek színében végbemenő változásokat azonosítani, majd az arcról a vérkeringésre utaló összegyűjtött jeleket algoritmusok vizsgálják, és mutatják ki, hogy az adott videó igazi vagy kamu.

Egyes mozdulatok és a modor ugyan árulkodók, de a legtöbb felhasználó észre sem veszi, vagy gyorsan végigfutva például a Twitteren, nem fordít időt a videó valóságtartalmának tanulmányozására. Nem meglepő módon kamuvideókat többmillióan osztanak meg, és már túl késő, mire megtudjuk, hogy nem valódiak.

Remélhetőleg az Intel rendszerével valamelyest változik a helyzet.

Jól veszi az akadályokat az olcsó négylábú robot

A pittsburghi Carnegie Mellon Egyetem (CMU) és a Berkeley Kaliforniai Egyetem kutatói olcsó, aprólábú robotokat vezérlő rendszert fejlesztettek. A robotok fel- és lemásznak lépcsőkön – a lépcsőfokok kb. ugyanolyan magasak, mint ők –, sziklás, egyenetlen, meredek, csúszós és más nehéz terepeken is mozgékonyak, átmennek réseken, jól egyensúlyoznak sziklákon, peremeken és szegélyeken, sőt, még sötétben is működnek.

Kulcsfontosságú, hogy kicsi robotok lépcsőn közlekedjenek, és többféle környezetet tudjanak eredményesen kezelni, mert csak így lesznek hasznosak otthonainkban, keresési és mentési munkálatoknál – vélik a kutatók. A rendszerrel működtetett gépek sok mindennapos feladatot elvégeznek.

cmu_robot_1.jpg

A csapat pici robottal tesztelte a rendszert. Szokatlan lépcsőkkel, közparkok domboldalaival, köveken, csúszós felületeken kellett boldogulnia. Lépcsőről lépcsőre úgy kellett ugrálnia, mintha akadályok lettek volna. Gépi látása és fedélzeti számítógépe komoly segítséget jelentettek.

Négyezer klónjával tesztelték egy szimulátorban, ott gyakorolta a járást, mászást, akadályok vételét. A szimulátor sebessége lehetővé tette, hogy egy nap alatt hat év tapasztalatra tegyen szert. A gép a tanulás közben elsajátított motorikus adottságaival kapcsolatos infóit is tárolta egy ideghálóban, amelyet a kutatók a fizikai robotba másoltak.

A fejlesztés abban is különbözik a hagyományos robotépítéstől, hogy a gép mozgásához semmiféle manuális mérnöki munkára nem volt szükség. A kutatók a magasszintű vezérlés esetében jól működő, kamerákkal történő környezet-feltérképezés, majd a térkép alapján való tervezés, tájékozódás gyakorlatával szintén szakítottak.

Amit a robot lát, meg is határozza, hogyan mozogjon, a vizuális input közvetlenül a vezérlőrendszerbe megy. A kutatók a lábmozdulatokat sem specifikálták. A megközelítés előnye, hogy mindig gyorsan reagál a terepre, és jól mozog rajta. Azért olcsó, mert nem kell térképet készítenie, terveznie – a teszten használt gép ára az alternatívák huszonötöde.

Az algoritmus lehetővé teszi a mostaninál sokkal szélesebb körben hozzáférhető olcsó robotok fejlesztését. A vizuális infókat és a test felőli visszacsatolásokat inputként használja, belőlük lesz a motorjait irányító output. Ennek a technikának köszönhetően robusztus, és ha például elcsúszik a lépcsőn, fel is áll. Ismeretlen környezetbe is mehet, amihez gyorsan alkalmazkodik.

A közvetlen látás-vezérlés gyakorlatot az élővilág, például az ember ihlette. Korábbi kutatásból kiderült, hogy kamera nélküli – „vak” – robotok ugyan képesek megbirkózni nehéz terepekkel, gépi látást hozzájuk adva, viszont rengeteget javul a teljesítményük. A lépcsőjárás módjával a fejlesztők szintén a magas akadályokat abszolváló embert másolták.

süti beállítások módosítása