A legnehezebb táblás játékokban is diadalmaskodik az MI

2018. december 18. - ferenck

Gari Kaszparov sakkvilágbajnok 1997-ben szenvedett vereséget az IBM Deep Blue szuperszámítógépétől.

Az azóta eltelt több mint két évtizedben a mesterséges intelligencia látványos fejlődésen ment keresztül. Míg Kaszparovot a „nyers” számítási erő, masszív komputerkapacitás késztette megadásra, Deep Blue utódai már maguktól tanulnak és következtetnek is. Jelenleg az Alphabethez, azaz a Google-hoz tartozó londoni DeepMind a kutatásfejlesztések élharcosa.

AlphaZero rendszerük sakk mellett japán sakkban, a sógiban és a goban is kiválóan teljesít. A technológia gyógyszerfejlesztéstől az anyagtervezésig nagyon sok területen alkalmazható.

Az algoritmus megerősítéses tanulással pallérozza tudását, mintegy 60 milliószor játszott saját magával, hogy még jobban értse a szabályokat. Utána az ember számára kvázi-legyőzhetetlen világvezető sakkprogrammal, Stockfish-sel mérkőzött meg, 1000 játszmából 155-öt megnyert, 6-szor kikapott, a többi döntetlenre végződött. Elmot, az elsőszámú sógi-algoritmust a játszmák 91, saját maga korábbi változatát, az I Szedol, a világranglista akkori negyedik helyezett dél-koreai gofenomént 2016-ban legyőző AlphaGo-t a pedig mérkőzések 61 százalékában verte meg.

A korábbi hasonló játéktechnológiákkal ellentétben, AlphaZero repertoárja nem korlátozódik egyetlen táblás játékra, hanem többen, ha nem a legtöbben teljesít kiválóan. Úgy tűnik, a DeepMind kifejlesztette a mindezek rögzített szabályait emberi segítség nélkül elsajátító algoritmust. Az MI többlépéses komplex problémákat old meg.

Kivételes képességeit, a szabályok automatikus elsajátítását részben a Google által kifejezetten MI-algoritmusokra kitalált 5 ezer tenzorfeldolgozó egységének (azaz óriási számítási kapacitásnak) (TPU) köszönheti.

Murray Campbell, az IBM kutatója a DeepMind munkájával kapcsolatban elmondta: a táblás játékok logikus kiindulási pontot jelentenek a mesterséges intelligencia számára. Mivel a játékos látja az összes fontos infót, könnyebb elemeznie őket, mint például a pókert.

A kártyajátékokban, például pont a pókerben azonban szintén sokat fejlődtek a gépek. A következő komoly kihívás a több-résztvevős videojátékok jelentik, és a DeepMindnál, valamint más vállalatoknál is dolgoznak már a StarCraft II-t kezelő algoritmusokon.