Hozzászoktunk, hogy a mesterséges intelligencia szöveget, képet, videót és kódot generál. Elkezdődött a következő fázis is: teljes világok létrehozása, szimulálása. A felhasználó által alakítható immerzív 3D környezetekké, lakókkal, működő fizikai rendszerekkel – kicsit úgy, mint a virtuális valóságban vagy a videójátékokban…
A jelenlegi MI kétféleképpen hozhat létre ilyen környezeteket.

Az első hasonlít a generatív modellek videókészítéséhez: a dinamikus, menet közbeni modellezés, ahogy a felhasználó interakcióba lép a közeggel, az MI a fizikáról és az objektumok viselkedéséről tanultak alapján előrejelzi minden egyes pixel változását. Ez már nem promptok interpretálása, mert csak modellezett világok képesek reagálni a bennük navigáló felhasználó inputjaira.
A módszerrel teljes világok generálhatók folyamatosan, képkockáról képkockára. Nagyon rugalmasak, realisztikusak és egyedi közegek, csakhogy a megközelítés elképesztően számításintenzív. A mai legkifinomultabb valósidejű világmodellek (amelyek nem tévesztendők össze az MI világmodelljével, világról alkotott „összképével”) konzisztenciája csak percekig tartható fenn, mert rengeteg kapacitás – és persze energia – kell hozzájuk.

A képkockánkénti generálás helyett ezért van szükség más módszerre, akár többre is, és itt visszatérünk a promptokhoz, az MI azokat alakítja át állandó geometriai modellekké, digitális eszközökké és fizikai metaadatokká. Az adatok (nem csak a metaadatok) utána letölthetők és más szoftvereszközökbe importálhatók, ott pedig tetszés szerint módosíthatók, szerkeszthetők és böngészhetők.
Több nagy MI-fejlesztő gőzerővel dolgozik saját modellezett világon: a Google a Genie 3 platformon, a hasonló dinamikus generálást alkalmazó Meta a Habitat 3-on, a Fei-Fei Li által vezetett World Labs a Marble-n, Elon Musk xAI-ja egy egyelőre meg nem nevezett közegen.
Ezek a környezetek számos felhasználási esettel kecsegtetnek: videójátékok és szórakozás, robotok és önvezető járművek gyakoroltatása, egészségügy – az emberi test mikro- és makroszinten is szimulálható –, gyártás, építészek tesztelhetnek bennük épületeket és így tovább. Bernard Marr jövőkutató szerint integráns részei lehetnek az üzleti élet és a társadalom generatív MI általi átalakításának.
A világmodellezés fontos lépés az általános mesterséges intelligencia, az AGI (artificial general intelligence) felé vezető úton. A világban történő navigáláshoz, a közeg megértéséhez az MI-nek tudnia kell, hogyan és miből épül fel, miként kapcsolódnak össze az elemei, és tartható fenn.
A generált modellekben benne van ez a lehetőség.










