Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Jönnek az újgenerációs nyelvi modellek

2022. június 27. - ferenck

A világ különböző pontjain működő 132 intézet kutatói  új mércét dolgoztak ki nyelvi modellek teljesítményének megítélésére. Egyértelmű céljuk, hogy növeljék a rendszerek képességeit, mert olyan feladatokat kellene megoldaniuk, amelyekre a mai csúcsmodellek nem képesek. A benchmark neve is…

Tovább

Saját nyelvet talált ki egy képgeneráló MI

Az elmúlt évtized gyors gépitanulás-fejlődése ellenére, kutatók még mindig gyakran nem értik, hogy automatizált rendszerek hogyan hoznak döntéseket. Komplex természetesnyelv-technológiák, mint az OpenAI GPT-3-ja néha annyira homályosan működnek, hogy szakértőknek komoly problémát okoznak a…

Tovább

MI segít, hogy szövegünket jól rangsorolja a Google

A médiában nagyon terjednek a legkorszerűbb mesterségesintelligencia-megoldások: ideghálókat alkalmaznak a videógyártásban, a Synthesia szkript alapján (a vállalati ügyfeleket megcélozva), személyre szabott videókat készít, amelyeket generatív ellenséges hálók renderelnek. Kész videóanyagokon a…

Tovább

Egy mesterséges intelligencia megmutatja nekünk, hogy ki Burger King

A mesterségesintelligencia-fejlesztések egyik élharcosa, a részben Elon Musk által alapított – a Tesla-vezér azóta távozott a cégtől –, sokáig nonprofit, egy ideje viszont üzleti alapon működő OpenAI körülbelül olyan fontos szerepet játszik a szakterületen, mint a Google által néhány esztendeje…

Tovább

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak. A GLIDE modell a…

Tovább

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja. Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a”…

Tovább

Tetovál az idegháló

Elsőként a világon, a DALL-E2 program tetoválást készített, és a munkát felvarrták egy érdeklődőre. A világpremiert az a tény jelenti, hogy eddig még senkit sem tetováltak mesterséges intelligencia által generált motívummal, képpel. Maga a DALL-E2 az MI-kutatások egyik élenjárójának, a kaliforniai…

Tovább

Tudatos vagy nem tudatos a mostani csúcs mesterséges intelligencia?

Ilya Sutskever, az OpenAI vezető tudósa szerint elképzelhető, hogy az MI máris tudatos. A nagy ideghálókra utalt, amelyek az öntudat kezdeti formáit mutathatják. Nézőpontja elég egyedi a szakmán belül, mert a mainstream álláspont szerint az MI, az utóbbi tíz év óriási fejlődése ellenére is távol…

Tovább

Kevesebb adaton tanulva alkot leírásból fotorealisztikus képeket egy MI

Az elmúlt évek látványos mesterségesintelligencia-eredményei a gépi tanuláson (machine learning) alapultak. A fejlődés azonban nem problémamentes, mert minél jobb eredményt ért el egy program, annál több adaton tanítják. Minél nagyobb az adatsor, annál komplexebb és drágább a rendszer, de ami talán…

Tovább

A multimodális mesterséges intelligencia színrelépése

Az utóbbi hónapok, néhány év legfontosabb mélytanulás-eredményeit a szöveggel és képekkel foglalkozó modellek, köztük a legendává vált GPT-3 és az EfficientNet érték el. Eközben beindultak a szövegek és képek közötti kapcsolatokkal foglalkozó projektek, és míg a legtöbb multimodális (több módban is…

Tovább
süti beállítások módosítása