Az utóbbi években virálissá váltak a Boston Dynamics és más vállalatok robotjait megörökítő videók. A technológiai csodák láttán elképedünk, ámulunk, bámulunk. Valóban lenyűgözőek, viszont a gépeket általában pont a látott speciális mozgásokra, forgatókönyvekre programozzák, és ha a feltételek megváltoznak, nem tudnak alkalmazkodni hozzájuk.
Ha egy robotnak csak lapos talajon kell navigálnia, a kerekes megoldás egyszerűbb és megbízhatóbb. Ha a terep durva és egyenetlen, célszerűbbnek tűnnek a lábak. Utóbbiak többek között tűzoltásnál, katasztrófa sújtotta övezetek bejárásánál lehetnek fontosak.
A Berkeley-i Kaliforniai Egyetem, a Carnegie Mellon Egyetem (CMU) és a Facebook kutatói a problémára választ keresve, négylábú gépek szokatlan és gyorsan változó terepen történő navigációját, mozgását, váratlan akadályok elkerülését biztosító, megerősítéses tanulás (reinforcement learning) alapú rendszert fejlesztettek.
A Rapid Motor Adaptation (RMA) nevű rendszer majdnem valósidőben működik; a robot egyenetlen terepeken – sáros ösvényeken, bozótos közegen, olajfoltos műanyaglapon – haladt keresztül, nagyon ritkán esett el menet közben.
A rendszer két, egyaránt szimulációban begyakoroltatott algoritmusból áll. A megerősítéses tanulás komponens a helyváltoztatás alapjainak irányítását tanulja meg, míg az adaptációs modul a környezet megjelenítését sajátítja el.
A két algoritmus aszinkron futott egy számítási eszközön. A végtagok és ízületek fél másodperccel korábbi adatait elemezve, azokhoz alkalmazkodva állították be a gép járását.
A teszteken a robot a szimulációban nem észlelt feltételek mellett, például törmelékhalmok között, rosszul kialakított lépcsőkön tevékenykedett. A feladatokat többször úgy ismételte meg, hogy közben különböző tömegű terheket cipelt.
Mindegyik forgatókönyvben hetven százalékosan vagy jobban teljesített. Amikor elesett, a malőrt vagy mindkét elülső lábát akadályozó törmelékek, vagy a lépcső felületének durva egyenetlenségei, dudorodások stb. okozták.
Az RMA egyike azon kevés robotikus rendszereknek, amelyeket nem kell az összes valószínűsíthető tereptípusra begyakoroltatni.