Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Miért tanítják a mesterséges intelligenciát, hogy Minecraftot játsszon?

2022. december 08. - ferenck

A 2009-ben indult, 2014 óta a Microsofthoz tartozó, népszerű Minecraft nyílt világú játék. A résztvevők blokkokból álló, pixeles 3D univerzumban fedezik fel annak nyersanyagait, eszközöket hozhatnak létre, építkezhetnek, és a játékmód függvényében ellenségekkel harcolhatnak, vagy együttműködhetnek másokkal. Játszható túlélő, kreatív és szemlélő módban is, Java-alapú kiadásában pedig új játékmechanikákkal, tárgyakkal és grafikával egészíthető ki. Előszeretettel használják az oktatásban, de infokommunikációs és más kutatásfejlesztésekhez is gyakran alkalmazzák.

Például mesterséges intelligenciákat tanítanak, pallérozzák gépi értelmüket a jellegzetes pixelvilágban.

A világhírű San Franciscói OpenAI (amelynek alapításában Elon Musk is részt vett) nemrég alkotta meg a földkerekség legfejlettebb Minecraftot játszó botját. Új gyakorlási módszerrel hetvenezer óra emberi játékot elemzett, és tanulta meg, hogyan alkosson pixeles szerszámokat, húzzon fel épületeket.

minrcraft.jpg

De ez csak a kezdet, mert a fejlesztők elmondták, hogy MI-jük idővel csúcstechnológiás megoldásokban, például valódi önvezető járművekben, atomerőművek és korlátlan mennyiségű megújuló energiaforrás működtetésében, kezelésében tölthet be fontos szerepet.

Az MI a Minecraftban „gyémánt-szerszámok” készítésére alkalmas első bot. Egy embernek huszonnégyezer egymást követő cselekvés és kb. húsz perc kell ugyanehhez. A bot esetében egyrészt utánzásos tanulást használtak, azaz az MI az óhajtott output megvalósítása érdekében, többezer emberi inputot figyelt, és javított rajtuk. A bot kialakításához egy másik népszerű és hatékony módszert, a próba-hiba alapú megerősítéses tanulást is alkalmazták.

Az utánzásos tanulással eddig az volt a legnagyobb gond, hogy a kutatóknak lépésről lépésre, manuálisan kellett címkézniük, és rengeteg idő elment vele. Az OpenAI teljesen szeparált, a címkézési folyamatot elvégző idegháló fejlesztésével oldotta meg a problémát. Előtte alkalmi gamerekkel játszattak kétezer óra Minecraftot, és felvették, hogyan érintik meg a billentyűzetet, egeret stb. Az MI ezeken az adatokon tanult, ez volt a „videó-előtanulás” (VPT).

A VPT-t is használva, a bot most már képes gépek számára korábban elképzelhetetlen dolgok létrehozására. Ez azért lehetséges, mert elődeit kizárólag megerősítéses tanulással trenírozták, és csak 970 lépéses folyamatokat abszolváltak. Az új MI azért boldogul el húszezernél több lépéssel is, mert fejlesztői a két tanulási stratégiát összekombinálták a gyakoroltatáshoz.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr917996348
süti beállítások módosítása