„2025-ben a mesterséges intelligencia megtanul látni, sokkal okosabb és pontosabb lesz, és elkezd számunkra megtenni dolgokat” – prognosztizál nagyon rövidtávra Mustafa Suleyman a DeepMind (ma Google DeepMind) egykori társalapítója, a Microsoft AI jelenlegi vezetője.
Véleménye szerint a mostani MI-rendszereknek komoly problémát okoz teljes kontextusunk megértése. Érzékelésük a csevegőablakra és interakciók meglehetősen szűk körére korlátozódik. Nem értik teljesen, hogy ezen kívül mit teszünk, és mik a szándékaink, amelyeket csak akkor tudnak tényleg felfogni, ha ugyanazt látják, amit mi.
Jó hír, hogy ez a képességük már adott. Az MI benne van az általunk használt szoftverben, és együtt böngészhet velünk. A szöveg volt az első interakciós forma, 2024 áttörésének pedig a hang számított. Suleyman szerint 2025-ben a látás jut el eddig a szintig.
A Microsoft AI egyik prioritása a böngészőben a felhasználóval együtt dolgozó MI. Így arról cseveghetünk vele, amit pont nézünk, vagy amivel pont foglalatoskodunk. Az interakció tényleg kétirányú lesz.
A látás komoly előrelépés, érzékelhetően különbözik az eddigi számítógép-használattól. De mellette is sok fejlődést fogunk idén tapasztalni, és mind csökkenti az MI széleskörű elterjedését kritikus mértékben gátló hallucináló hajlamát. Ha kételkedünk abban, amit mond, akkor korlátozott a használata. A bizalom az MI alapja. Szerencsére a modellek egyre jobbak, és efelé haladnak.
Suleyman szerint a hallucinációk teljesen nem küszöbölhetők ki, de jövő ilyenkor sokkal kevesebbet fogunk bosszankodni miattuk. A legtöbb témában vagy annyit, vagy többet érnek majd, mint a keresőmotorok. Nem egyetlen technológia előrelépéséről, hanem a spektrum óriási változást hozó, folyamatos bővüléséről van szó.
„Végre belépünk az ágensek korába, évtizedek óta álmodozunk erről a pillanatról” – magyarázza Suleyman, majd a Következő hullám (2023) könyvére utalva megemlíti a szűk és az általános (AGI) közötti általa bevezetett kompetens MI-t (ACI). Az ágensek lényegében ezt a szintet érik el: nemcsak beszélnek hozzá, hanem konkrét dolgokat is végeznek a felhasználó számára. Ez kritikus jelentőségű változás.
Az ágenseknek azonban eleget kell tenniük a legmagasabb szintű megbízhatósági, biztonsági, felelősség-követelményeknek, máskülönben nem tudjuk kihasználni a bennük rejlő lehetőségeket. Mindezek mellett egyéb problémákat, például csomó más rendszerrel történő integrálásukat is meg kell oldani.
Mindenesetre eljött az idejük.