A korábban a Dota 2 videojátékban az ember felett diadalmaskodó mesterséges intelligenciát fejlesztő, 2015-ben alapított, San Francisco székhelyű OpenAI robotvégtagot irányító és a Rubik-kockát egy kézzel kirakó MI-t alkotott. A feladathoz olyan szintű ügyesség kell, hogy a mozdulatokat mi emberek is kifejezetten nehéznek tartjuk.
A kutatócsoport megtanította a mesterséges intelligenciának a kereskedelmi forgalomban beszerezhető, a Shadow Robot Company által kidolgozott kar irányítását. A rendszer a „próba-hiba” módszert alkalmazó megerősítéses tanulással (reinforcement learning) dolgozott.
„Kezdetben semmit nem tud a kéz mozgatásáról, hogy miként és merre mozdítsa, mint ahogy a kocka reakciójáról sem, ha például oldalra vagy előre forgatjuk” – magyarázza Peter Welinder, az egyik kutató.
Az MI pontokat kapott a sikeres műveletekért, például ha megforgatta a kockát, vagy ha eredményesen mozgatta el az elejét stb. Úgy programozták, hogy maximalizálja a pontszámokat.
A valós környezetben történő teszt előtt szimulációban gyakorolt; az ott eltöltött idő kb. 13 ezer évnek felelt meg.
Egy másik kutató, Lilian Weng elmondta, hogy az MI finom mozdulatokra való betanítása komoly kihívást jelentett, mert a robotkar és egy tárgy között nagyon sok szimultán kontaktpont keletkezik.
Az MI-nek nem kellett foglalkoznia a kocka helyes kirakásával. A feladatot képérzékelők és kifejezetten e célra fejlesztett algoritmus oldották meg, az algoritmus adta a rendszernek a mozgásokra vonatkozó utasításokat. A mesterséges intelligencia így a szükséges fizikai mozdulatokra összpontosíthatott, nem kellett mással törődnie.
Közben megtanulta, hogyan javítsa ki a hibáit, például, ha túlforgatta a Rubik-kockát.
A kirakás időtartama attól függött, hogy a kocka eredetileg mennyire volt „összekavarva.” Welinder elmondta: a legsikeresebb próbálkozás 3 percig tartott.
A kutatócsoport bizakodik, hogy a mesterséges intelligencia idővel általánosabb feladatokat, például festést vagy origami kirakását is el tudja majd végeztetni a karral.