Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Kik a csapatjátékosok?

2021. november 12. - ferenck

Csapatsportokhoz egyéni és csoportos képességek, azok képlékeny keveréke szükséges. A DeepMind kutatói focizó humanoid ágensekbe integrálták a két cselekvéstípust.

Szimulált focicsapatokhoz dolgoztak ki edzésmódszert. A játékosok, azaz az ágensek a fizikaihoz hasonló virtuális pályán tanultak meg futni, passzolni, védekezni, gólt lőni.

team.jpg

A kutatók tizenhat ágenst treníroztak, hogy kétszemélyes csapatokban versengjenek egymással. Egy ágens nyomást helyezhet mind az ötvenhat ízületére, nyomon követheti az általuk bezárt szögeket, pozíciókat, gyorsaságukat, megfigyelheti a többi játékos és a pályán lévő más objektumok elhelyezkedését, és az ő gyorsaságukat is.

Az edzés első szakaszában a modell olyan mozgásokat tanult meg, mint a futás és a fordulás. Kódolót és dekódolót tanítottak be felügyelt tanulás mellett, hogy jelezzék előre az ágens mozgását. Valódi focistákról készült 105 perc mozgásrögzítés (motion-capture) anyagot kaptak hozzá.

team0.jpg

A kódoló megtanulta megjeleníteni az ágens fizikai állapotát, míg a dekódoló ezeket a reprezentációkat alakította át az ízületekre kifejtett nyomatékokká.

Második lépésben, különféle kódolók négy adottságot sajátítottak el – pont követését, cselezés közbeni pontkövetést, pontra rúgni a labdát, és persze gólt lőni. Az ágens fizikai állapotának reprezentálása mellett, képességeiket is megjelenítették, a dekódoló pedig az ízületek mozgásának módját határozta meg. Négy másik kódoló az adottság-modell reprezentációjának újraalkotását információkhoz való hozzáférés nélkül sajátította el.

team1_1.png

Végül az ágensek felügyelet mellett megtanultak csapatban versenyezni, különféle reprezentációkat összekombinálni. Minél többet edzettek, annál ügyesebbé váltak. Kezdetben például az esetek harminc százalékában orra buktak, később viszont a passzolástól a góllövésig, minden szinten jól teljesítettek.

A komplex feladatok kivitelezéséhez szükséges összes adottsághoz egynél természetesen több edzőmódszerre van szükség. Ezekben az esetekben a kutatók a felügyelet melletti, a megerősítéses és a csapatban történő tanulást kombinálták össze egymással.

A feladatmegvalósításhoz szükséges absztrahálást maguktól megtanuló ágensek fejlesztése lesz a következő lépés.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr7816693320
süti beállítások módosítása