Öt MI egyesítette erejét, és embereket vertek meg egy stratégiai játékban

2018. július 03. - ferenck

Az Elon Musk és Sam Altman által 2015. december 11-én alapított nonprofit kutatóvállalat OpenAI, azaz Nyílt MI célja az emberhez barátságosan viszonyuló mesterséges intelligencia fejlesztése, amely mindannyiunknak komoly hasznára lehet a jövőben. A más intézményekkel és cégekkel együttműködő, 1 milliárd dolláros befektetésként indult OpenAI szabadalmai és eredményei bárki számára elérhetők, használhatók.

A 2016-ban bemutatott OpenAI Gym digitális játszótérben algoritmusok, ágensek és botok főként játékokon, elsősorban megerősítéses tanulással (reinforcement learning) gyakorolnak. A rendszer a legjobbak rangsorolása helyett a hasonló feladatok elvégzésére is alkalmas általánosító algoritmusokat részesíti előnyben, és ez koncepcióváltás napjaink egyre szűkebb területekre fókuszáló kutatási trendjeihez képest.

Öt ideghálóból álló csoportjuk, az OpenAI Five rendeltetése, hogy valósidőben játsszák a Dota 2 stratégiai játékot. A rendszer gyorsan fejlődik, és már meg tud verni öt amatőr humán versenyzőt. A győzelem szépséghibája, hogy megszorításokat kell bevezetni a játékmenetben.

Augusztusban a rendszer szintet léphet, mert egy nemzetközi versenyen, a fejlesztő Valve Corporation által évente megrendezett The International-en (TI) profi játékosok csoportjával méri össze az erejét.

Öt játékosból álló két csapat küzd egymással, az ellenfél főhadiszállásának központjában lévő „Ősi” szerkezetet kell megsemmisíteni. Mindegyik gamer más karaktert – „hőst” – irányít. A hősöknek megvannak a maguk erényei és gyengéi, a siker kulcsa viszont az együttműködés.

A fejlesztők speciális karaktereket rendeltek az öt ideghálóhoz, és megszorításokat alkalmaztak velük szemben.

Az OpenAI Five algoritmusai külön-külön kezdtek gyakorolni, aztán egymás ellen, majd csapatban játszottak. Hol saját maga a csapat, hol korábbi változatai voltak az ellenfelek. Egy-egy gyakorlónapon 180 évnyi tapasztalatra tettek szert, és jellemzően profi versenyzők által alkalmazott stratégiákat sajátítottak el.

Egyik algoritmus sem tud kommunikálni a többiekkel, a kooperáció mindig valamelyikük kezdeményezése volt, de akkor is megmaradt, amikor humán versenyző lépett egy algoritmus helyére.

A kezdeményezés előrevetíti az MI jövőjét. Mindegyik algoritmusnak nyolcad másodperc alatt kellett nagyjából ezer lehetséges lépés közül választania. Ez pedig azt jelenti, hogy a Dota 2 lényegesen komplexebb a gónál, amelyben ugyanennyi idő alatt 250 opcióból szemezgethet az MI.

A projekt másik különlegessége, hogy algoritmusok általában nem dolgoznak csapatban, most viszont kiderült, hogy nemcsak egymással, hanem emberekkel is képesek kooperálni.