Kézmozdulatokat ismer fel a szingapúri mesterséges intelligencia

2020. augusztus 17. - ferenck

A felismerőtechnológiák dinamikusan fejlődnek. A beszédre specializált botok egyre jobban végzik a munkájukat, gépi tanulással csiszolódott programok tárgyakat, állatokat stb. azonosítanak, míg az arcfelismerés ma már sok jogi vitát generál.

De mi van a mindennapokban oly gyakran használt kézmozdulatokkal, hogyan boldogulnak velük a gépek, miként találják ki, hogy mit akarunk gesztusainkkal kifejezni, képesek-e egyáltalán rá?

Mert, ha nem, akkor még a legkifinomultabb mesterséges intelligenciák sem tudják feldolgozni az emberi kommunikáció egyik alapvető aspektusát. Eddig legalábbis így volt, de változik a helyzet.

A sebészetben használt robotok, az egészségfigyelő műszerek és egyes játékrendszerek komoly előrelépést jelentettek ezen a téren is, de valami mindig hiányzott.

A szingapúri Nanyang Műszaki Egyetem (NTU) egyik kutatócsoportja viszont bőrszerű elektronikai megoldást és gépi látást összekombinálva, kézmozdulatokat felismerő mesterségesintelligencia-rendszert fejlesztett.

Az eddigi legfőbb problémát a rendszerbe táplált pontatlan adatok jelentették. Ezek az adatok általában magunkon viselhető, a felhasználóval összevissza kontaktusban lévő szenzorokból érkeznek. Sok objektum eleve nem látható és a gyenge megvilágítás is okozhat gondokat. A szenzorikus és a vizuális adatok integrálása további problémákat okozhat.

Mozgásrögzítés (motion capture) alapú kesztyűket szintén használnak térbeli adatok, például kézmozdulatokra vonatkozó információk gyűjtéséhez. Ezek a megoldások is nehézkesek, és a szingapúri kutatók úgy döntöttek, hogy szakítanak a robotikából ellesett módszerekkel, inkább a felhasználó kezére passzoló, nyúlékony szenzorokat alkalmaznak helyettük. A biológia ihlette meg őket – szén nanocsövekből készült érzékelőik az emberi bőrre emlékeztetnek.

A rendszer lényege az emberi bőrhöz hasonló érzékelés és a látvány emberi agyhoz hasonló feldolgozása. A kutatók az MI-t három idegháló-megközelítés egyesítésével dolgozták ki. Az eredmény magáért beszél: sokkal jobban felismeri a kézmozdulatokat, mint bármelyik korábbi rendszer. Mind a vizuális, mind a szenzorikus adatok pontosabbak.

A megoldás távolról sem tökéletes, viszont úgy tűnik, az MI legalább érti a gesztusokat. Labirintusban csupán kézmozdulatokkal vezéreltek egy robotot, és a gép sikeresen keresztülment rajta.