Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Világokat modellez a mesterséges intelligencia

2025. december 22. - ferenck

Hozzászoktunk, hogy a mesterséges intelligencia szöveget, képet, videót és kódot generál. Elkezdődött a következő fázis is: teljes világok létrehozása, szimulálása. A felhasználó által alakítható immerzív 3D környezetekké, lakókkal, működő fizikai rendszerekkel – kicsit úgy, mint a virtuális…

Tovább

3D világok generálása és szerkesztése mesterséges intelligenciával

A mesterségesintelligencia-kutatás egyik úttörője, a gépi látás 2010-es évekbeli gyors fejlődését elindító ImageNet adatkészlet kidolgozója, Fei-Fei Li startupja, a World Labs piacra dobta a kereskedelmi forgalomban beszerezhető első generatív világmodellt, a Marble-t (Márvány). Az MI szöveges…

Tovább

A Google generatív médiamodelljei a legelterjedtebbek

Az Artificial Analysis kétszáznál több felhasználó és szervezet bevonásával végzett felmérése alapján 2025 harmadik negyedévében a kép- és videóalkalmazások területén Google Gemini és Veo modelljei terjedtek el legjobban. A válaszadók 74 százaléka használja a Geminit (kép), 69 százalékul pedig a…

Tovább

Megválaszolatlan kérdések Sora, az OpenAI csodaalkalmazása kapcsán

Október első hetében az OpenAI közkinccsé tette végtelen mennyiségű, kizárólag MI-vel generált, legfeljebb tíz másodperces videót kínáló, TikTok-stílusú Sora appját. „Cameót”, megjelenésünket és hangunkat utánzó hiperrealisztikus avatárt készíthetünk magunkról, mások cameóit pedig (engedélyektől…

Tovább

Nőket vetkőztetnek mesterségesintelligencia-alkalmazások

Csak egy fotó és a sok rendelkezésre álló MI-app valamelyike elég ahhoz, hogy rosszindulatú személyek– az illető beleegyezése nélkül – bárkiről meztelen képeket csináljanak, majd terjesszenek az online térben. 2022 óta 15 millió ilyen anyagot töltöttek le a világhálóról, a meztelen…

Tovább

Jobb karakterek és stílusok készíthetők egy új mesterségesintelligencia-modellel

Karakterek konzisztenciája, megszemélyesítése, mint szakterület, hosszú utat tett meg az első szövegből képet generáló modellek óta.  A Textual Immersion 2022-ben bemutatta, hogyan tanulható meg karakterek beágyazása, hogyan használható ez a beágyazás későbbi képek létrehozásához. A DreamBooth…

Tovább

Miért lett kék 1831-ben a Nap?

1831-ben egy vulkánkitörés annyi kéngázzal árasztotta el az eget, hogy csaknem két Fahrenheit-fokkal lehűtötte a bolygót, éhínséget, pusztulást és társadalmi feszültségeket okozva. A hatás mértékéről mindent elmond, hogy az északi féltekén még a Napot is másként látták. Éltető csillagunk komor…

Tovább

Háromezer éves megaerődről készültek szenzációs drónfelvételek a Kaukázusban

Új drónfelvételek alapján kiderült, hogy a Déli Kaukázusban felfedezett, mintegy háromezer éves erőd kb. negyvenszer nagyobb, mint korábban gondolták. Az új információ átírhatja a kelet-európai késő bronzkorra vonatkozó elképzeléseinket. A Dmanisis Gora nevű „megaerőd” valamikor Krisztus előtt 1500…

Tovább

Videógeneráló mesterséges intelligencia az Adobe szerkesztőcsomagjában

Az Adobe bejelentette a webszolgáltatásként elérhető Firefly Video Modellt, amelyet év végéig a vállalat Premiere Pro szoftvercsomagjába integrálnak. A modellel kb. két perc alatt maximum ót másodperces videók generálhatók szöveges és vizuális promptok alapján. Kész videók módosíthatók, bővíthetők…

Tovább

Hat másodperces videókat készít mesterséges intelligenciával a YouTube

Hamarosan egy csomó mesterséges intelligenciával támogatott új eszköz áll a YouTube tartalomkészítői rendelkezésére – jelentette be a cég szeptember tizennyolcadikai Made on YouTube rendezvényén, New York Cityben. MI-vel, szöveges utasításokra (promptokra) készülhetnek a mindössze hat másodperces…

Tovább
süti beállítások módosítása