Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Virálissá vált a szövegből képalkotás

2022. július 22. - ferenck

A gépi tanulás fejlődése alkalmat ad arra is, hogy újféle szórakozási módokat próbáljunk ki, például képzeletbeli pizzákról generáljunk képeket, vagy akcióhősök szájmozgását hozzuk összhangba slágerekkel. Egyes eszközök lehetővé teszik, hogy az „internet népe” a populáris kultúra elemeit korábban…

Tovább

Jönnek az újgenerációs nyelvi modellek

A világ különböző pontjain működő 132 intézet kutatói  új mércét dolgoztak ki nyelvi modellek teljesítményének megítélésére. Egyértelmű céljuk, hogy növeljék a rendszerek képességeit, mert olyan feladatokat kellene megoldaniuk, amelyekre a mai csúcsmodellek nem képesek. A benchmark neve is…

Tovább

Saját nyelvet talált ki egy képgeneráló MI

Az elmúlt évtized gyors gépitanulás-fejlődése ellenére, kutatók még mindig gyakran nem értik, hogy automatizált rendszerek hogyan hoznak döntéseket. Komplex természetesnyelv-technológiák, mint az OpenAI GPT-3-ja néha annyira homályosan működnek, hogy szakértőknek komoly problémát okoznak a…

Tovább

MI segít, hogy szövegünket jól rangsorolja a Google

A médiában nagyon terjednek a legkorszerűbb mesterségesintelligencia-megoldások: ideghálókat alkalmaznak a videógyártásban, a Synthesia szkript alapján (a vállalati ügyfeleket megcélozva), személyre szabott videókat készít, amelyeket generatív ellenséges hálók renderelnek. Kész videóanyagokon a…

Tovább

Egy mesterséges intelligencia megmutatja nekünk, hogy ki Burger King

A mesterségesintelligencia-fejlesztések egyik élharcosa, a részben Elon Musk által alapított – a Tesla-vezér azóta távozott a cégtől –, sokáig nonprofit, egy ideje viszont üzleti alapon működő OpenAI körülbelül olyan fontos szerepet játszik a szakterületen, mint a Google által néhány esztendeje…

Tovább

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak. A GLIDE modell a…

Tovább

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja. Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a”…

Tovább

Tetovál az idegháló

Elsőként a világon, a DALL-E2 program tetoválást készített, és a munkát felvarrták egy érdeklődőre. A világpremiert az a tény jelenti, hogy eddig még senkit sem tetováltak mesterséges intelligencia által generált motívummal, képpel. Maga a DALL-E2 az MI-kutatások egyik élenjárójának, a kaliforniai…

Tovább

Tudatos vagy nem tudatos a mostani csúcs mesterséges intelligencia?

Ilya Sutskever, az OpenAI vezető tudósa szerint elképzelhető, hogy az MI máris tudatos. A nagy ideghálókra utalt, amelyek az öntudat kezdeti formáit mutathatják. Nézőpontja elég egyedi a szakmán belül, mert a mainstream álláspont szerint az MI, az utóbbi tíz év óriási fejlődése ellenére is távol…

Tovább

Kevesebb adaton tanulva alkot leírásból fotorealisztikus képeket egy MI

Az elmúlt évek látványos mesterségesintelligencia-eredményei a gépi tanuláson (machine learning) alapultak. A fejlődés azonban nem problémamentes, mert minél jobb eredményt ért el egy program, annál több adaton tanítják. Minél nagyobb az adatsor, annál komplexebb és drágább a rendszer, de ami talán…

Tovább
süti beállítások módosítása