Az MIT (Massachusetts Institute of Technology) kutatói komplex környezetek másodpercek alatti 3D feltérképezését elkészítő mesterségesintelligencia-rendszert fejlesztettek robotokhoz. A mai gépi tanulást és a klasszikus gépi látás alapelveit kombináló technológia megváltoztathatja a kutatási-mentési műveletekben résztvevő gépek munkáját.
A robot fedélzeti kamerájának korlátlan mennyiségű képét fel tudja dolgozni, pontosan rekonstruálja belőlük 3D-ben a helyszínt, miközben valósidőben becsüli meg a gép térbeli pozícióját. A technika neve szimultán lokalizálás és térképezés (simultaneous localization and mapping, SLAM), rendszerek ezzel alkotják újra környezetüket, és határozzák meg, hogy hol vannak.

Hagyományos SLAM-módszerek előre kalibrált kamerákat igényelnek, zsúfolt vagy vizuálisan komplex helyszíneken gyakran nem működnek. Gépitanulás-modellekkel egyszerűsödött a folyamat, egyszerre viszont csak hatvan kép dolgozható fel velük, ezért nem praktikusak valóvilágbeli feladatokhoz, amelyekben gyorsan kell többezer képkockát elemezni.
Az MIT-kutatók a jelenetet kisebb altérképekre szedték, amelyeket inkrementálisan összehangoltak. A rendszer koherens 3D modellben egyesíti őket. A robot így gyorsabban is mozog, és a térbeli pontosság is megmarad.

Nagyon egyszerűnek tűnt, de elsőre nem működött – vallották be a kutatók. Később rájöttek, hogy azért nem, mert a gépitanulás-modellek gyakran apró torzulásokat vezetnek be altérképeken, amely szabványos elforgató és átalakító technikákat használva, megnehezíti a pontos összehangolást.
Az altérképek minden egyes torzulását megragadó és korrigáló matematikai keretet dolgoztak ki, hogy a rendszer konzisztensen végezze az összehangolást. Gépi tanulást és klasszikus optimalizálást kombinálva, rögtön lett eredmény.
Az új technológia gyorsabb és pontosabb a mostani térképező technikáknál. Nem kell hozzá speciális kamerakalibrálás, plusz feldolgozóeszköz. Egyszerűsége miatt robotok, AR- és VR-rendszerek használhatják, de raktárak automatizálásában is fontos szerepet játszhat.










