Jönnek a multifunkcionális ideghálók?

2023. január 02. - ferenck

A többszáz különböző feladatot általánosító, kezelő algoritmusoknak csak a kezdeti szakaszában vagyunk, gyerekcipőben járnak még, 2022 több fejlesztése viszont bizonyította: a mélytanulásban (deep learning) megvan a potenciál hozzájuk. Ha felgyorsulnak és eredményesek lesznek az ezirányú fejlesztések, közelebb kerülünk az általános mesterséges intelligenciához.

A több feladatra (multi-task) használható modellek lehetőségei – a feladatok száma – drámai mértékben bővültek. Kutatók a mesterséges ideghálók által elsajátítható adottságok kereteit feszegették, és a fejlesztések 2023-ban nyilván folytatódnak.

A nagy nyelvi modellek emergens módon kialakuló képességei jelentették az inspirációt. Másrészt, ezek, a szövegeken és képeken gyakoroltatott modellek ma már meg tudják találni a két különböző adattípus közötti kapcsolatokat. Harmadrészt, ahhoz, hogy ugyanaz a modell előbb verset, majd számítógépes programot írjon, nem kell áthangolni az architektúrát.

A Google PaLM modellje demonstrálta, hogy nyelvmegértéssel és szöveggenerálással kapcsolatos, többszáz feladatot néhány lépés alatt képes megoldani. Egyes esetekben az ezekre a célokra finomhangolt modelleket és az embert is felülmúlta.

A DeepMind (spanyolul macskát jelentő) Gato transzformere hatszáznál több változatos feladat kezelését tanulta meg: Atari játékok használatát, építőkockák egymásra rakását, robotkar alkalmazását, képaláírások generálását stb. Egyelőre nem annyira jó bennük, mint a külön-külön egyikre, másikra trenírozott modellek, viszont már maga a tény is figyelemre méltó.

A rendszert felügyelet melletti tanulással gyakoroltatták, szimultán használt hozzájuk sok és nagyon különböző adatsort. Ezeket a képi, szöveges, cselekvés stb. adatsorokat megerősítéses tanuláson alapuló ágensek generálták.

A Google kutatói a robotikára is próbálják alkalmazni az új megközelítést. Az RT-1 transzformer lehetővé teszi, hogy egy robot hétszáznál több feladattal boldoguljon. A cselekvésekből és a képekből tokeneket generáló rendszer másfél év alatt összegyűjtött adatsoron tanult. Az adatsorban robotflottákról szóló 130 ezer epizód található. Korábbi technológiákkal összevetve, feltűnően jól teljesített.