Egyetlen állóképből 3D animációkat generál egy algoritmus

2018. december 27. - ferenck

A Harry Potter regények mágikus fotói egy kivételtől eltekintve, ugyanolyanok, mint a hétköznapi fényképek. A kivétel: a rajtuk látható karakterek animáltak; mozognak, mosolyognak, időnként eltűnnek…

A fantasy után hamarosan a valóságban is megjelenhetnek hasonló képek. Chung-Yi Weng, a Washington Egyetem doktorandusza és munkatársai Photo Wake-Up („fénykép, ébredj fel”) szoftvere ugyanis lehetővé teszi egyetlen statikus képkocka központi karakterének animálását, míg a kép többi része változatlan marad.

A feladat sokkal nehezebb, mint gondolnánk. A számítástudomány egyik megoldatlan problémáját, testhelyzetek pontos felbecslését kell kezelni hozzá. Egy személy kétdimenziós képénél a gépilátás-algoritmusnak ki kell találnia, hogy az illető milyen háromdimenziós pozícióban van.

Ez azért bonyolult, mert a testet gyakran más testrészek takarják el, például, ha valaki karba font kézzel áll, a végtagnak csak egyes részei láthatók. Sokan próbálkoztak a megoldással, főként 3D testhálókkal, de csak részsikereket értek el, időnként a valóságtól távoli, mulatságos végeredménnyel.

Weng és társai a Microsoft és a Max Planck Intelligens Rendszerek Intézete által fejlesztett SMPL programot használták. Első lépésben az illető testét 2D-ben kivágták a képről, majd ráfotóztak egy 3D csontvázat. Az animálható csontváz a mozgás érzetét kelti, és így – igaz csak meghatározott (és korlátozott) feltételek mellett – felbecsülhető a testpozíció.

A kódnak szemből, tetőtől talpig látnia kell a testet. Kisebb takarásokat képes kezelni, nagyobbakat, például keresztbe tett lábakat viszont már nem.

Weng érdeme, hogy a 2D kivágásra realisztikus 3D modellt eredményező meghajlítási módszert talált ki. A testalakú hálót 2D térben helyezték el, és a hajlító/görbítő algoritmus előbb a testrészeket azonosítja, majd pontosan összehangolja őket a 2D kivágással.

A 2D után az egészet 3D-vé alakították át, és a módszer összetett sziluettekkel is jól működött. A fejre különösen figyelnek, és az algoritmus speciális mozgásokat, például a tekintetet is kiszámolja.

A kutatók a csontváz és a kivágás közötti orientáció megváltoztatását biztosító, a hibákat korrigáló, az animációt finomhangoló felhasználói felületet is fejlesztettek.

A bámulatos végeredmény úgy néz ki, mint egy animált fénykép. A például embermodellezéshez, avatárok létrehozásához használható technika a kiterjesztett valóságban (augmented reality, AR) is működik.