A Google Gemini mesterségesintelligencia-modelljének különleges, nemcsak a chatbotok digitális világában, az internetes keresés közegében, hanem robotként a fizikai valóságban is működő változatát jelentette be.
A Gemini Robotics a nagy nyelvmodellek kapacitását térbeli következtetéssel kapcsolja össze. Lehetővé teszi, hogy a modell például utasítást adjon egy robotkarnak: „tedd oda az almát!” Az utasításokat az LLM szűri, azonosítja a szándékokat, hogy miről beszélünk, majd a gép által kivitelezhető parancsokká szedi szét azokat.
A Google eddig nem ért el különösebb eredményeket a robotikában. Az anyacég Alphabet felvásárolt ugyan pár startupot, de 2023-ban beszüntette a praktikus problémák megoldására alapított robotika részlegét.
A mostani lépéssel más vállalatok példáját követik, fizikai intelligencián, az MI valódi környezetbeli alkalmazásain dolgoznak. Két ellentétes irányból érkező trend konvergenciájáról van szó: robotikai cégek egyre inkább növelik gépeik mesterséges intelligenciáját, az MI nagyágyúi pedig robotokat építenek. Az Nvidia vezetősége tavaly októberben prognosztizálta, hogy a fizikai intelligencia lesz az MI következő hulláma.
MI többféleképpen integrálható robotba. Például javíthatunk gyakoroltatásukon, a nagy nyelvmodell által adott utasítások azonban különösen érdekesek.
A Figure startup edényeket 2024-ben odébb rakó humanoidja már jelezte az irányt, aztán az OpenAI-ból indult, majd az Amazon által felvásárolt Covariant raktári robotkarokhoz hasonlót fejlesztett: a gép vizuális utasításokat kapott, például teniszlabdát kellett A pontból B pontba raknia.
Mikor kezdenek el munkahelyeken dolgozni ezek a robotok, és mikor költöznek be otthonainkba?
A Figure tervei alapján hamarosan. Jelenleg nagymennyiségű, évi 12 ezer robot gyártására alkalmas üzemet építenek. Gyakoroltatásuk és tesztelésük, hogy biztonságosan dolgozhassanak emberek mellett, azonban hosszabb ideig eltarthat. A Figure versenytársa, az Agile Robotics az egyetlen cég az USA-ban, amelynek MI-vel felerősített robotjaiért már fizetnek is az ügyfelek, igaz elkülönítve dolgoznak, mert még nem felelnek meg az összes biztonsági kritériumnak.
Otthonunk lesz a végső határ. Gyárakkal összehasonlítva jóval kaotikusabb és előrejelezhetetlen környezet, ahol mindenki viszonylag közel tartózkodik egymáshoz. Még a Gemini Robotics darabjainak is hosszú szimulációs és valóvilágbeli teszteken kell átmennie ahhoz, hogy ilyen közegekben boldoguljon. A teszteknek raktárak, hotelek és kórházak adhatnak otthont, és a gépeket távirányítva segíthetik humán működtetők.