Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

2022. május 06. - ferenck

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak. A GLIDE modell a…

Tovább

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja. Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a”…

Tovább

Tetovál az idegháló

Elsőként a világon, a DALL-E2 program tetoválást készített, és a munkát felvarrták egy érdeklődőre. A világpremiert az a tény jelenti, hogy eddig még senkit sem tetováltak mesterséges intelligencia által generált motívummal, képpel. Maga a DALL-E2 az MI-kutatások egyik élenjárójának, a kaliforniai…

Tovább

Tudatos vagy nem tudatos a mostani csúcs mesterséges intelligencia?

Ilya Sutskever, az OpenAI vezető tudósa szerint elképzelhető, hogy az MI máris tudatos. A nagy ideghálókra utalt, amelyek az öntudat kezdeti formáit mutathatják. Nézőpontja elég egyedi a szakmán belül, mert a mainstream álláspont szerint az MI, az utóbbi tíz év óriási fejlődése ellenére is távol…

Tovább

Kevesebb adaton tanulva alkot leírásból fotorealisztikus képeket egy MI

Az elmúlt évek látványos mesterségesintelligencia-eredményei a gépi tanuláson (machine learning) alapultak. A fejlődés azonban nem problémamentes, mert minél jobb eredményt ért el egy program, annál több adaton tanítják. Minél nagyobb az adatsor, annál komplexebb és drágább a rendszer, de ami talán…

Tovább

A multimodális mesterséges intelligencia színrelépése

Az utóbbi hónapok, néhány év legfontosabb mélytanulás-eredményeit a szöveggel és képekkel foglalkozó modellek, köztük a legendává vált GPT-3 és az EfficientNet érték el. Eközben beindultak a szövegek és képek közötti kapcsolatokkal foglalkozó projektek, és míg a legtöbb multimodális (több módban is…

Tovább

Zsugorodnak a nagy nyelvi modellek

A Google által néhány éve felvásárolt londoni DeepMind három tanulmányt tett közzé a nagy nyelvi modellek lehetőségeiről. Két transzformer-modellel többféle nyelvi feladatot próbált különféle naprakész technikákkal megoldani. Ugyanakkor, ha ezen modellek folyamatosan javulnak, a velük járó…

Tovább

Mi várható az MI-alapú nyelvi modelleknél?

A világhírű GPT-3 mesterséges intelligencia, a fejlesztő OpenAI-val közösen dolgozó Microsoft jóvoltából immár könnyebben elérhető, mint volt korábban. Ez azonban több problémát is felvet. Nem véletlen, hogy a redmondi nagyvállalat közölte: tervei szerint a nyelvi mesterségesintelligencia-modellre…

Tovább

Közkinccsé teszik a világ egyik legértelmesebb mesterséges intelligenciáját

A GPT-3 nyelvi modell kereskedelmi forgalomba kerülésének első lépését a fejlesztő OpenAI – akkor még nonprofit kutatóintézet – 2019-es profitorientált vállalattá alakulása jelentette. Néhány hónappal később a Microsoft exkluzív kereskedelmi hozzáférést kapott a modellhez. A privát bétaváltozat 2020…

Tovább

Mesterségesintelligencia-kutatók a mesterségesintelligencia-etikáról

Technológusok folyamatosan dolgoznak a biztonságos, nyílt és etikus infokommunikáció megvalósulásán. Egyes szervezetek például a magánadatok biztonságát védő, etikai problémákra megoldást kínáló szabványokat vezetnek be. Máskor közvetlenebb megoldásokhoz fordulnak, mint tette azt háromezer…

Tovább
süti beállítások módosítása
Mobil