Szerepjátékokban (role-playing game, RPG), például a modern klasszikus Grand Theft Autoban sok játékos saját megjelenése alapján dolgozza ki játékbeli karakterét. A beépített „személyre szabó” technológiák ugyan egyre kifinomultabbá váltak, de ennek ellenére sok és fáradságos manuális munkára van szükség. Tucatnyi vagy akár több száz paraméter közül válogathatunk, hogy finomítsunk a külső jegyeken, és a folyamat akár órákig eltarthat.
A NetEase kínai játékfejlesztő cég mesterséges intelligenciával foglalkozó egyik csoportja automatizált módszert dolgozott ki játékkarakterek szabvány portréfotóból történő létrehozására.
Első lépésként az MI lefényképezi a felhasználó/játékos arcát.
A karaktergenerálás az arckép elrendezésével kezdődik. Az utánzó modulból és jegyeket, tulajdonságokat kivonatoló részből álló, mélytanulás (deep learning) alapú keretnek ez az alap, a gyakorló input.
Az imitátort azért találták ki, hogy a játékmotort szimulálva automatikusan létrehozza a stílusában konzisztens karaktert. Figyelembe veszi a felhasználó arcának paramétereit (haj, szempilla stb.), majd renderelt és frissíthető arcképpel áll elő.
Miután az imitátor „megtanulta a leckét”, a tulajdonságjegyeket kivonatoló rész is munkába áll, és különféle számításokkal optimalizálja az arc paramétereit.
De hogyan garantálható a „globális” megjelenés és a „lokális” részletek pontossága a médiumokon átívelő változás közben, amikor a valódi fénykép manga-, vagy animeszerű karakterré alakul át?
Az úgynevezett képhasonlóság-mérési problémát mély ideghálóval és többfeladatos tanulással oldották meg, és sikerült elérniük, hogy az arc megkülönböztető jegyeiből a lehető legtöbb megmaradjon.
A kínai kutatók által kidolgozott arcrekonstruálási módszert, a szokásos rácshálókkal szemben, a csontok elhelyezkedése határozza meg. Az új modellel az arc paramétereinek kimutatása, előrejelzése egyértelműbb.
Az automatizált folyamathoz fényképek mellett festett portrék, szkeccsek és karikatúrák is használhatók. A 3D karakterek jobban hasonlítanak az eredetihez, mintha más eljárással hozták volna létre őket. A kutatók ezt azzal magyarázzák, hogy módszerük inkább az „arc szemantikáján” alapul, mint a nyers pixeleken.