Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Szintet lép a Google videót készítő mesterséges intelligenciája?

2022. október 18. - ferenck

A Meta (Facebook) bő egy hete mutatta be a rövid szöveges leírásból (promptból) nagyon rövid videót generáló Make-A-Video mesterségesintelligencia-modellt. Egy héttel később a Google tovább lépett: Phenaki nevű rendszere néhány mondatból tetszőleges hosszúságú, komplett narratívát hoz létre. A…

Tovább

Szövegből videót alkotó mesterséges intelligenciát fejlesztette a Meta

A Meta (azaz a Facebook) bemutatta Make-A-Video („Csinálj videót”) nevű, rövid szöveges utasítások (promptok) alapján rövid videókat generáló mesterségesintelligencia-rendszerét. Begépeljük például, hogy „szuperhős- ruhába, vörös köpenybe öltözött kutya átrepül az égen” mondatot, mire az MI öt…

Tovább

Hogyan várják boldog zöldségek a vacsorát?

Hogyan generáljunk szuperszámítógép nélkül, közönséges grafikus kártyával másodpercek alatt szövegből képet, például hogyan „várják boldog zöldségek a vacsorát?” A kérdés kicsit sci-finek (másrészt bugyutának) hangzik, pedig nem az, mert a Müncheni Ludwig-Maximilian Egyetem (LMU) Stable Diffusion…

Tovább

Virálissá vált a szövegből képalkotás

A gépi tanulás fejlődése alkalmat ad arra is, hogy újféle szórakozási módokat próbáljunk ki, például képzeletbeli pizzákról generáljunk képeket, vagy akcióhősök szájmozgását hozzuk összhangba slágerekkel. Egyes eszközök lehetővé teszik, hogy az „internet népe” a populáris kultúra elemeit korábban…

Tovább

Földfelszíni változások műholdas követése

A gépi látás egyik nagy kihívása a műholdas képalkotás javítása, ezeknek a képeknek a helyes értelmezése. Több kutatócsoport e felvételekre támaszkodva követi a klímaváltozás hatásait, jelez előre vulkánkitöréseket, vagy figyeli Kína covid utáni gazdasági felépülését. A műholdas képek hírszerző…

Tovább

Algoritmus tanulmányozza az agy huzalozását

Indiai és brazil kutatók az emberi agy különböző részei közötti kapcsolatokat tanulmányozó algoritmust fejlesztettek. Rendeltetése, hogy jobban megismerjük az agy huzalozását. Diffúziós mágneses rezonanciás képalkotással (dMRI) generált nagymennyiségű adat elemzésében segít. Kb. 150-szer gyorsabb,…

Tovább

Képalkotó sejtautomata

A mélytanulás (deep learning) többféle neurális-alapú képgenerátort kínál: generatív ellenséges hálózatokat (GAN), diffúziós modelleket, önkódoló rendszereket stb. Mindegyiknek vannak előnyei és hátrányai, együtt viszont csábító lehetőségeket kínálnak adatszintézishez, vizuális műalkotáshoz. A…

Tovább

MI segít, hogy szövegünket jól rangsorolja a Google

A médiában nagyon terjednek a legkorszerűbb mesterségesintelligencia-megoldások: ideghálókat alkalmaznak a videógyártásban, a Synthesia szkript alapján (a vállalati ügyfeleket megcélozva), személyre szabott videókat készít, amelyeket generatív ellenséges hálók renderelnek. Kész videóanyagokon a…

Tovább

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak. A GLIDE modell a…

Tovább

Kevesebb adaton tanulva alkot leírásból fotorealisztikus képeket egy MI

Az elmúlt évek látványos mesterségesintelligencia-eredményei a gépi tanuláson (machine learning) alapultak. A fejlődés azonban nem problémamentes, mert minél jobb eredményt ért el egy program, annál több adaton tanítják. Minél nagyobb az adatsor, annál komplexebb és drágább a rendszer, de ami talán…

Tovább
süti beállítások módosítása