A mesterségesintelligencia-forradalom újabb fontos lépéseként a földkerekség infokommunikációs technológiák fejlesztésében és az MI adaptálásában egyik legkevésbé jeleskedő régiója is (végre) színre lépett.
A 2021-ben alakult Chilei Nemzeti Mesterséges Intelligencia Központ (CENIA) elindítja az online térben a kifejezetten latin-amerikai nyelvekre és kulturális környezetekre tervezett, nyílt forrású Latam-GPT nyelvmodellt.
Szükség is volt rá, mert a régióban folyamatosan nő a generatív MI-platformok iránti igény. Az Egyesült Államok és India után a világon Brazíliában használják legtöbben a ChatGPT-t.
A projektben Latin-Amerika és a Karibi-térség harminchárom intézete vesz részt, húsz országból több mint nyolc terabájtnyi szöveges adatot gyűjtöttek össze hozzá. A GPT-3.5-höz hasonlítható modell ötvenmilliárd paraméteres.
A Latam-GPT tervezői figyelembe vették azt a szükségletet, hogy mesterséges intelligenciájuknak értenie kell a helyi nyelvjárásokat, a térség viharos történelmét és a kulturális nüánszokat. Mindezekről a globális modellek fejlesztői hajlamosak megfeledkezni.
Az OpenAI GPT-it vagy a Meta Llama modelljeit az angolon kívül ugyan sok más nyelven is tanítják, de képességeik ennek ellenére korlátozottak ezeken a nyelveken, nem is beszélve a nyelvjárásokról és a helyi idiómákról. A „latin-amerikaiaknak latin-amerikai MI-t” – a Latam-GPT-t – ennek megfelelően gyakoroltatták, az obligát spanyol és portugál mellett a kecsua, a guarani és más őslakos nyelveken szintén kommunikál, és speciális karibi dialektusokat is ért.
A fejlesztés két évig tartott, és a Latam-GPT kitalálóinak arra is gondolniuk kellett, hogy latin-amerikai kutatók képesek legyenek közvetlenül kísérletezni nagy nyelvmodellekkel (LLM).
Az első változat idén szeptemberben indul és ingyenes. A következő években az egyelőre csak szöveges, nyílt modellt szervezetek saját specifikus szektoraikra, például az oktatásra, az egészségügyre vagy a mezőgazdaságra alkalmazhatják. Sikeréhez az őslakosok, bevándorló közösségek és történelmileg marginalizált más csoportok részvétele is szükséges.
Ugyanakkor a térség sok országában, köztük az infokom technológiákban legfejlettebb Chilében is, a helyiek tiltakoznak az MI-modellek felépítéséhez és működtetéséhez infrastruktúrát nyújtó, de köztudottan rendkívül energia- és vízigényes adatközpontok létrehozása ellen.
Másrészt, a projektet a mesterségesintelligencia-szakadék csökkentésére tett első komoly lépésének tekintik.