Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Jobb karakterek és stílusok készíthetők egy új mesterségesintelligencia-modellel

2025. június 24. - ferenck

Karakterek konzisztenciája, megszemélyesítése, mint szakterület, hosszú utat tett meg az első szövegből képet generáló modellek óta.  A Textual Immersion 2022-ben bemutatta, hogyan tanulható meg karakterek beágyazása, hogyan használható ez a beágyazás későbbi képek létrehozásához. A DreamBooth…

Tovább

Miért lett kék 1831-ben a Nap?

1831-ben egy vulkánkitörés annyi kéngázzal árasztotta el az eget, hogy csaknem két Fahrenheit-fokkal lehűtötte a bolygót, éhínséget, pusztulást és társadalmi feszültségeket okozva. A hatás mértékéről mindent elmond, hogy az északi féltekén még a Napot is másként látták. Éltető csillagunk komor…

Tovább

Háromezer éves megaerődről készültek szenzációs drónfelvételek a Kaukázusban

Új drónfelvételek alapján kiderült, hogy a Déli Kaukázusban felfedezett, mintegy háromezer éves erőd kb. negyvenszer nagyobb, mint korábban gondolták. Az új információ átírhatja a kelet-európai késő bronzkorra vonatkozó elképzeléseinket. A Dmanisis Gora nevű „megaerőd” valamikor Krisztus előtt 1500…

Tovább

Videógeneráló mesterséges intelligencia az Adobe szerkesztőcsomagjában

Az Adobe bejelentette a webszolgáltatásként elérhető Firefly Video Modellt, amelyet év végéig a vállalat Premiere Pro szoftvercsomagjába integrálnak. A modellel kb. két perc alatt maximum ót másodperces videók generálhatók szöveges és vizuális promptok alapján. Kész videók módosíthatók, bővíthetők…

Tovább

Hat másodperces videókat készít mesterséges intelligenciával a YouTube

Hamarosan egy csomó mesterséges intelligenciával támogatott új eszköz áll a YouTube tartalomkészítői rendelkezésére – jelentette be a cég szeptember tizennyolcadikai Made on YouTube rendezvényén, New York Cityben. MI-vel, szöveges utasításokra (promptokra) készülhetnek a mindössze hat másodperces…

Tovább

Huszonöt képig ingyenes a Midjourney

David Holz, a Midjourney vezérigazgatója augusztus 21-én bejelentette, hogy a szövegből képet generáló alkalmazás a honlapjukon huszonöt képig ingyen használható. Korábban a Discordról lehetett elérni a felületet, hogy MI-vel képet készítsünk. A folyamat sok babrálást igényelt, ami gyakran…

Tovább

Magasra tette a lécet a Google legújabb képgenerátora, az Imagen 3

A képgenerátorok minden egyes új hullámával javul, szélesebb alkalmazói réteg számára lesz hasznosabb a technológia. A Google nemrég mutatta be a korábbi változatokhoz képest előrelépést hozó Imagen 3, szöveges utasításokból vizuális outputot generáló modelljét. A képek minősége jobb, jobban…

Tovább

Képgenerátor modellek versenye

A mesterségesintelligencia-modelleket tesztelő Artificial Analysis szolgáltatás, az LMSys nagy nyelvmodelleket versenyeztető Chatbot Arénájához hasonlóan, „szövegből kép” ranglistát vezetett be. Az imgsys és a Gen-AI Arena szintén képgenerálással foglalkozik, de ott csak nyílt forrású modellek…

Tovább

Egyre több a nyílt és félig nyílt generatív modell

Az Nvidia és az Alibaba új nagyteljesítményű nagy nyelvmodellt (LLM) tett közzé, míg a Stability AI bemutatta a zászlóshajónak számító, szövegből képet generáló Stable Diffusion friss, karcsúsított változatát. Az Nvidia és az Alibaba modellek súlyai/értékei teljesen nyíltak, a Stable Diffusion 3…

Tovább

Megjelent az első kínai szöveget videóvá alakító modell

Mérföldkőhöz érkezett a kínai Kuaishou vállalat: június hatodikán elindította az első nyilvánosan tesztelhető, szövegből videót ingyen generáló, jelenleg már hatszázmillió felhasználós mesterségesintelligencia-modellt. Neve Kling, és az OpenAI Sora MI-jéhez hasonlóan (elvileg) akár kétperces,…

Tovább
süti beállítások módosítása