Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Robotok írhatják a saját kódjukat

2022. november 11. - ferenck

A Google új módszert mutatott be nagy nyelvi modellek (large language models, LLM) felhasználására. Lényege, hogy robotok emberek utasításai (promptok) alapján képesek megírni a saját kódjukat. A munka a vállalat egyik új nyelvi modelljén alapul. A modell lehetővé teszi, hogy robotok megértsenek…

Tovább

Fiktív szavakkal átverhetők a képeket generáló ideghálók

Egyes ellenséges generatív hálózatok (GAN) által létrehozott képek rendeltetése a gépilátás-rendszerek megtévesztése. Az általuk létrehozott mintázatok alkalmasak az egyébként hatékony arc- és tárgyfelismerő rendszerek átvágására, olyan dolgokat és arcokat értelmeznek félre, amelyeket különben simán…

Tovább

Nagy nyelvi modellek mindenkinek

Általában nagy infokom vállalatok fejlesztenek nagy nyelvi modelleket. Az ok világos: kisebb cégek nem tudják megengedni maguknak sem az egyre gigantikusabb adatsorokat, sem a szintén napról napra növekvő, szükséges számítási kapacitásokat. Független kutatóknak ezért nyílik ritkán lehetőség a…

Tovább

Virálissá vált a szövegből képalkotás

A gépi tanulás fejlődése alkalmat ad arra is, hogy újféle szórakozási módokat próbáljunk ki, például képzeletbeli pizzákról generáljunk képeket, vagy akcióhősök szájmozgását hozzuk összhangba slágerekkel. Egyes eszközök lehetővé teszik, hogy az „internet népe” a populáris kultúra elemeit korábban…

Tovább

Jönnek az újgenerációs nyelvi modellek

A világ különböző pontjain működő 132 intézet kutatói  új mércét dolgoztak ki nyelvi modellek teljesítményének megítélésére. Egyértelmű céljuk, hogy növeljék a rendszerek képességeit, mert olyan feladatokat kellene megoldaniuk, amelyekre a mai csúcsmodellek nem képesek. A benchmark neve is…

Tovább

Saját nyelvet talált ki egy képgeneráló MI

Az elmúlt évtized gyors gépitanulás-fejlődése ellenére, kutatók még mindig gyakran nem értik, hogy automatizált rendszerek hogyan hoznak döntéseket. Komplex természetesnyelv-technológiák, mint az OpenAI GPT-3-ja néha annyira homályosan működnek, hogy szakértőknek komoly problémát okoznak a…

Tovább

MI segít, hogy szövegünket jól rangsorolja a Google

A médiában nagyon terjednek a legkorszerűbb mesterségesintelligencia-megoldások: ideghálókat alkalmaznak a videógyártásban, a Synthesia szkript alapján (a vállalati ügyfeleket megcélozva), személyre szabott videókat készít, amelyeket generatív ellenséges hálók renderelnek. Kész videóanyagokon a…

Tovább

Egy mesterséges intelligencia megmutatja nekünk, hogy ki Burger King

A mesterségesintelligencia-fejlesztések egyik élharcosa, a részben Elon Musk által alapított – a Tesla-vezér azóta távozott a cégtől –, sokáig nonprofit, egy ideje viszont üzleti alapon működő OpenAI körülbelül olyan fontos szerepet játszik a szakterületen, mint a Google által néhány esztendeje…

Tovább

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak. A GLIDE modell a…

Tovább

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja. Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a”…

Tovább
süti beállítások módosítása