Egy robot figyelte, ahogy a pittsburghi CMU (Carnegie Mellon Egyetem) egyik kutatója, Shikhar Bahl kinyitotta a jégszekrényt. Minden mozdulatot és pozíciót elemezve, igyekezett utánozni a látottakat. Először, másodszor, harmadszor nem sikerült neki, de néhány óra gyakorlás után már igen.
„Az utánzás nagyszerű mód a tanulásra. Egyelőre nem oldottuk meg az emberek közvetlen figyeléséből tanuló robotok problémáját, de jelenlegi kutatásaink komoly lépésnek számítanak ebben az irányban” – jelentette ki a munkatársaival új tanulási módszert kidolgozó Bahl. (A módszer neve WHIRL – In-the Wild Human Imitating Robot Learning).
Egyszeri vizuális imitációhoz használt algoritmusról van szó, amellyel a robot közvetlenül tanul emberi cselekedeteket, interakciókat megörökítő videókból, majd az információkat új feladatok megoldásához általánosítja.
Mindezekből előbb-utóbb elsajátíthatja a háztartási munkákat. Erre azért van lehetősége, mert otthon folyamatosan különféle feladatokat végzünk. A robot összegyűjtött képadatai alapján dönti el, hogyan hajtson végre háztartási tevékenységeket.
Bahl és kollégái kamerával és szoftverükkel felvérteztek egy közönséges robotot. A gép húsznál több feladatot tanult meg: megnyitni és elzárni berendezéseket, kinyitni és becsukni szekrényajtókat, kihúzni és visszatolni fiókokat, fedőt tenni edényekre, kiszedni a szemeteszsákot a konyhai szemetesből stb.
Mindig embereket figyelt, aztán gyakorolt, a gyakorlásból pedig tanult.
„Ez az egyik módja, hogyan alkalmazzunk otthon robotokat. Ahelyett, hogy előre programozott, érkezésük előtt gyakoroltatott gépekre várnánk, technológiánkkal megvalósítható, hogy hazavisszük a robotot, és miközben alkalmazkodik a környezethez, minket nézve tanul” – nyilatkozta a projektben szintén résztvevő Deepak Pathak.
A mai robottanítás általában vagy imitációval, vagy megerősítéses tanulással történik. Előbbi esetben manuálisan működtetjük a gépet, hogy tanulja meg az adott feladat elvégzését. Egy feladatot többször elismétlünk, mielőtt tényleg tanulna. A másik esetben sokmillió példán gyakorol, a gyakorlás szimulációban történik, majd az ott megtanultakat valódi környezetben kell alkalmaznia.
Mindkét módszer egyetlen feladattal, strukturált környezetben működik jól, de nehéz bővíteni és másra alkalmazni. Ezzel szemben a WHIRL könnyen skálázható, nem szűkíthető le egyetlen speciális tevékenységre, és valódi otthoni környezetben is működik.
A kutatók most YouTube és Flickr videókat néző, azokból tanuló változatán dolgoznak.
De mi van akkor, ha a háztartási munkákat nagyon rossz hatékonysággal végző személyekhez kerülnek a szegény robotok?