Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Hogyan készítsen MI képet a mi macskánkról?

2023. január 10. - ferenck

A tipikus szövegből képet generáló mesterséges intelligenciák előállhatnak például egy macska, de nem a mi macskánk képével. Azért nem, mert a szöveges utasítást, a promptot nehéz olyan pontosan megadni, hogy a macskánkat a többi macskától megkülönböztető összes jegy benne legyen. Nvidia- és…

Tovább

2022 a szintetikus képek éve volt

2022 a mesterségesintelligencia-történelem egyik szó szerint is leglátványosabb éve volt. Szinte emberi szintű szövegeket, képeket és kódokat generáló rendszereket ismertünk meg. Ezek a rendszerek komoly kérdéseket vetnek fel a kreativitás jövőjével kapcsolatban. Vegyi és fizikai folyamatokat…

Tovább

A Disney ideghálója tetszés szerint öregíti, fiatalítja színészek arcát

A Csillagok háborúja és tévésorozatok számítógép által generált színészei után, a Disney színészek „vizuális” életkorát a képernyőn megváltoztató ideghálót fejlesztett. A technológiával lehetővé válik, hogy televíziósok és filmesek automatizált folyamattal megöregítsenek, megfiatalítsanak…

Tovább

Művészek mesterséges intelligenciával készített utánzatok ellen

A mesterségesintelligencia-technológiák berobbantak a képalkotásba, 2022 az ilyen jellegű alkalmazások diadalmenete volt. A gépi képalkotással azonban lehetővé vált művészek stílusának utánzása, például teljesen élethű másolatok – hamisítványok – készítése is. Miután a világhírű dél-koreai…

Tovább

Mesterséges intelligencia dönt a lesről

A katari foci világbajnokságon a Félig Automatizált Lestechnológiát (SAOT) használják lesszituációk eldöntéséhez. A rendszer a szintén Katarban rendezett tavalyi Arab Kupán debütált, de Európában, Bajnokok Ligája meccseken is bemutatkozott már ebben a szezonban. A VAR-t, azaz a videobírót hivatott…

Tovább

A promptmérnök lesz a közeljövő egyik legfontosabb IT-állása?

A szöveg- és a képgenerátorok, GPT-3, AI21 és Jurrasic, illetve DALL-E, Midjourney és Stable Diffusion korában a promptok azok a mesterséges intelligenciának adott szöveges utasítások, inputok, amelyek alapján az MI szöveget, képet generál. Néhány szóban, mondatban leírjuk neki, mit szeretnénk…

Tovább

Mesterséges intelligenciával még a gyorséttermek is gyorsabbak lesznek

Az amerikai gyorsétterem-láncoknál soha nem volt akkora munkaerőhiány, mint most. A szektor aranybánya lehet az élelmiszerek, ételek előkészítését automatizáló startupoknak. Mivel a hatékonyság az egyik legfőbb szempont, sok mesterségesintelligencia-alkalmazás jut fontos szerephez. Az Egyesült…

Tovább

Szintet lép a Google videót készítő mesterséges intelligenciája?

A Meta (Facebook) bő egy hete mutatta be a rövid szöveges leírásból (promptból) nagyon rövid videót generáló Make-A-Video mesterségesintelligencia-modellt. Egy héttel később a Google tovább lépett: Phenaki nevű rendszere néhány mondatból tetszőleges hosszúságú, komplett narratívát hoz létre. A…

Tovább

Szövegből videót alkotó mesterséges intelligenciát fejlesztette a Meta

A Meta (azaz a Facebook) bemutatta Make-A-Video („Csinálj videót”) nevű, rövid szöveges utasítások (promptok) alapján rövid videókat generáló mesterségesintelligencia-rendszerét. Begépeljük például, hogy „szuperhős- ruhába, vörös köpenybe öltözött kutya átrepül az égen” mondatot, mire az MI öt…

Tovább

Hogyan várják boldog zöldségek a vacsorát?

Hogyan generáljunk szuperszámítógép nélkül, közönséges grafikus kártyával másodpercek alatt szövegből képet, például hogyan „várják boldog zöldségek a vacsorát?” A kérdés kicsit sci-finek (másrészt bugyutának) hangzik, pedig nem az, mert a Müncheni Ludwig-Maximilian Egyetem (LMU) Stable Diffusion…

Tovább
süti beállítások módosítása