Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Google: vigyázzunk a személyes adatainkra, ha a Geminit használjuk

2024. március 05. - ferenck

A mesterséges intelligencia okostelefonos térhódítása már a ChatGPT színrelépése előtt megkezdődött, a generatív MI diadalútja viszont látványosan felgyorsította folyamatot. Már 2022 végén, 2023 elején egyértelmű volt, hogy a chatbotok és társaik okostelefonos integrációja visszafordíthatatlan. De miért is akarnánk visszafordítani?

Az idei androidos és iPhone-frissítéseket nem meglepő módon az MI fogja uralni. A legtöbb a Google-tól jön majd, viszont nem árt, ha odafigyelünk rájuk, mert nagyon megváltoztathatják készülékhasználatunkat.

gemini_1.jpg

A cég nemrég nevezte át ChatGPT-szerű chatbotját, a Bardot, és az új brand mellé emlékeztetőt is fűzött. Az emlékeztetés inkább figyelmeztetés, hogy a mamutvállalat milyen adatokat gyűjt miközben a mesterségesintelligencia-alkalmazását használjuk.

Bard most már Geminiként fut, és a magánadatok, a privacy védelmében a Google kimondta, hogy az MI-vel folytatott interakció során a következőket gyűjti össze: infókat tartózkodási helyünkről, felhasználási adatokat, és mindenféle visszajelzést tőlünk.

Humán kiértékelők elolvashatják ezeket, megjegyzéseket fűzhetnek hozzájuk, feldolgozhatják beszélgetéseinket. A nagyvállalat az anonimitást megőrizve, igyekszik megvédeni a privacy-t, azaz a beszélgetéseket szétválasztja a Google-fiókoktól még mielőtt a kiértékelő személyek hozzájuk férnének.

Az emlékeztető óva int bizalmas információ, bármely olyan adat megosztásától, amelyet nem szeretnénk, ha a kiértékelők olvasnának, vagy a Google később felhasználna. Az elemzésekkel termékeik, szolgáltatásaik, gépitanulás-technológiáik minőségén kívánnak folyamatosan javítani – hangsúlyozzák.

A Google figyelmeztetése azért (is) fontos, mert szinte vakon megbízunk a generatív MI chatbotokban. Ez azért érdekes, mert általában odafigyelünk, óvatosak vagyunk appok telepítésével, engedélyek megadásával, a böngésző kiválasztásával, a Facebookon, a Google-on és más platformokon megosztott adatainkkal, MI-chatbotokkal szemben azonban megfeledkezünk az egészséges óvatosságról. Úgy érezzük, mintha privát beszélgetést folytatnánk egy segítőkész új baráttal, és hirtelen mindent meg akarunk osztani vele.

A Google erre figyelmeztet, és emlékeztet: (egyelőre) nem új baráttal, hanem jelenleg még személytelen mesterséges intelligenciával kommunikálunk.

Mesterséges intelligencia és autonóm rendszerek a hadviselésben

Az Egyesült Királyság hadserege és a Védelemtudomány és Technológia Laboratórium (Dstl) nemrég Ausztrália és az Egyesült Államok fegyveres erőivel működött együtt. Az AUKUS partnerség keretében, mérföldkőnek számít, hogy a mesterséges intelligenciára és autonóm fegyverekre összpontosító tesztgyakorlatot végeztek.

A Robotikus Járművek Megbízható Művelete Vitatott Környezetekben (TORVICE) tesztgyakorlatra tavaly került sor. Elektronikus támadások, GPS-szakadás és más fenyegetések közben vizsgáltak robotikus járműveket és szenzorokat, hogy megállapítsák a jövő hadviselésében fontos szerepet játszó autonóm rendszerek ellenálló képességét.

uk_hadsereg_ai.jpg

A technológiák széleskörű katonai elterjedése előtt kritikus fontosságú megérteni, miként valósítható meg MI-rendszerek megbízható működése az elektronikus hadviselésben, cyberfenyegetések közben.

Amerikai és brit autonóm járművek felderítő küldetést végeztek, az ausztrálok rendszereiket zavaró harctéri elektronikus támadásokat szimuláltak. A teljesítményadatok segítenek megerősíteni a védelmet, a rendszerhibák és leállások elleni óvintézkedések meghatározását, illetve kideríteni, mennyire robusztusak ezek a rendszerek támadáskor.

A három seregben bevezetésre kerülő robotikus és automatikus technológiák átalakítják a hadviselést. A mostani munka a tavaly áprilisi első AUKUS autonómrendszerek-teszten alapul. A védelmi miniszterek decemberi találkozóján bejelentették, hogy a Rugalmas és Autonóm Mesterségesintelligencia-Technológiákat (RAAIT) idén integrálják a hadseregekbe.

Katonai vezetők szerint az MI és az autonómia ígéretét sikeresen megvalósítva, ezek a rendszerek abszolút megváltoztatják a területet, csökkentik a katonákra leselkedő veszélyeket, kockázatokat. Kulcsfeladatok (szenzorok működtetése, logisztika stb.) nagy térségben kivitelezhetők velük, parancsnokok is több opció közül válogathatnak.

Az együttműködéssel a területi fejlesztéseket kívánják felgyorsítani, a haderők közötti interoperabilitást növelni, maximalizálni szakértelmüket, fokozni az elrettentést.  

 

Szerelmespárt hozott össze a mesterséges intelligencia

A nyelvi korlátokon átívelő szerelem hol sikeres, hol nem. Egy, mesterséges intelligencián keresztül kommunikáló amerikai-mexikói pár esetében viszont úgy tűnik, hibátlanul működik.

Közös barát közvetítésével, vakrandin ismerkedtek meg egymással. Az amerikai-mexikói határ két oldalán laknak, és négy hónapig a legváltozatosabb MI-eszközöket használták, hogy feloldják az angol és a spanyol közötti különbségeket.

ai_love.jpg

Az első személyes találkozóra Mexicaliban került sor, Brenda Ochoa ott dolgozik. Ő és partnere, a 45 éves arizonai LeRoy Romero fordítóalkalmazásokat, például a Google Translate-et használták. Megosztoztak egy margarita pizzán, de a nyelvi különbségek miatt nem csevegtek, csacsogtak, nem fárasztották egymást felesleges információkkal, mint ahogy első randikon szoktak. Mégis tetszett mindkettőnek.

Következő appként, a Captions-t használták. Az alkalmazás munkában és magánéletben egyaránt jól működik. Videókat alkottak, szerkesztettek, természetesen feliratoztak, szabtak személyre vele. Szintén segített, hogy az app a szájmozgásokat is jól szinkronizálja, működik a fordítás.

ai_love0.jpg

A Captions masszív fordító MI-je egyedi alkalmazásként is elérhető, Lipdub a neve. A felhasználó természetes hangját utánozza, követi szájmozgását, miközben végzi a fordítást. Hasonló technológiák más kontextusban akár riasztók is lehetnek, Ochoa és Romero kapcsolatában viszont tényleg csodát tettek.

Mindössze négyóra autózásra laknak egymástól, havi egy alkalommal találkoznak személyesen Mexicaliban, ha pedig nincsenek együtt, különböző MI-fordítóalkalmazásokat használva beszélgetnek. Romero otthonosan mozog a technológia világában, kétirányú szinkronfordító fülhallgatója is van, amivel könnyebb a valósidejű beszédértés.

Másokkal nem használják ezeket a technológiákat, emellett Ochoa angolul, Romero pedig spanyolul tanul. El is jegyezték egymást, nyárra tervezik az esküvőt. Azt még nem tudják, hol fognak élni.

A Bank of England vezetője szerint nem okoz tömeges állásvesztést az MI

A Bank of England vezetője, a bankári munkakör előtt gazdaságtörténészként dolgozó Andrew Bailey szerint nem indokolt a mesterséges intelligencia miatti tömeges munkavesztéstől való félelem.

A gazdaság, a munka mindig alkalmazkodik a megváltozott viszonyokhoz, az ember pedig megtanulja, hogyan alkalmazkodjon hozzájuk. Bailey úgy véli, hogy az ember-gép együttműködés eredménye jobb, mintha a gépek ember nélkül dolgoznának.

Az Egyesült Királyság vállalatai egyre nagyobb mértékben fektetnek a technológiába; hatékonyságban és a termékek minőségében is nyerhetnek vele. A hatékonysági előnyök több szektorra érvényesek. Stowell báró, a Lordok Házából figyelmeztetett is: ha nem cselekszenek gyorsan, az Egyesült Királyság kimarad az MI-aranylázból.

bank_of_england.jpg

A Lordok Kommunikációs és Digitális Bizottsága jelentést készített a nagy nyelvmodellekről (LLM). A szerzői jogi (copyright) törvények frissítését és a kormányzati szabályozás egyértelműségét sürgetik. Ha túl sok a szabályozás, akkor az ország lemarad az MI fejlesztésében – hangsúlyozzák.

Bailey és a lordok egyetértenek abban, hogy az MI előnyeire kell fókuszálni, a tényleges kockázatokat pedig kezelni kell. A pénzügyi szolgáltatásipar csak nyerhet a technológia felelős alkalmazásával.

A generatív MI komoly potenciális előnyöket hozhat a pénzügyi intézeteknek, például a visszaélések elleni harcban is segít. Óriási adatsorok elemzésével pontosabbá teszi, felgyorsítja a nyomozásokat. Humán elemzők munkáját mégsem tudja helyettesíteni Legfőbb előnye a gyorsasága, meglévő folyamatokat gyorsít fel, javít az elemzők munkáján, megkönnyít nekik feladatokat.

Teljes banki és pénzügyi hasznát csak az adatminőséget optimalizáló, az adatokból következtetéseket levonó robusztus digitális és automatizált folyamatok bevezetését követően lehet megállapítani. Ha övék az elsőbbség, akkor a bankok jobban ki tudják a használni a folyamatosan fejlődő MI-technológiákat.

Egy januári tanulmány alapján az Egyesült Királyság biztosítóinak és bankjainak 89 százaléka tavaly bevezetett MI-megoldásokat. Adatoptimalizáló problémák miatt viszont gyakran még nem tudják eléggé kiaknázni a technológia lehetőségeit. 

Banglades a leggyorsabban növekvő technológiai csomópont programozóknak

Az egyik vezető globális szoftverfejlesztő platform, a GitHub adatai alapján Banglades a leggyorsabban fejlődő programozási csomópont. A fejlesztői fiókokat országonként követő jelentés feltárja a dél-ázsiai ország figyelemre méltó növekedését: 2022 harmadik negyedévével összevetve, 2023 harmadik negyedévében 66,5 százalékkal nőtt a fiókok száma.

Ebben a három hónapban 945696 bangladesi fejlesztő volt a GitHubon, egy évvel korábban pedig „csak” 568145. Egy év leforgása alatt közel kétharmaddal nőtt a szám, és ekkora arányú növekedést egyetlen más országban nem tapasztaltak.

banglades.jpg

A világ egyik legnagyobb szoftverfejlesztő csomópontja, a GitHub nyílt forrású együttműködéshez használt nyilvános (repos) és csak a résztvevők számára elérhető zárt adattárakból áll. Évek óta használják egyes programozók kiértékelésére, az adatokból látjuk minden egyes ország fejlesztőinek a hozzájárulását. Ezekből a számokból már kikövetkeztethetők a leggyorsabban növekvő országok.

Az adatokat negyedévente teszik közzé, és sokan meglepődtek a nagymértékű növekedésen. Persze mint minden adatkészletnek, úgy ennek is megvannak a maga korlátai, és maga a GitHub is csak töredéke az adott ország szoftverfejlesztésének. Mindenesetre kitűnik belőle, hogy feljövőben vannak a nyugati techipar által sokáig ignorált egyes országok.

banglades0.jpg

Az abszolút számok persze teljesen mások. Nem meglepő módon az USA az első 20,2 millió, India a második 13,3 millió, Kína a harmadik 6,9 millió, és Brazília a negyedik 5,4 millió fejlesztővel. Jellegzetesen ezek a magas GDP-jű országok dominálják az infokom technológiákat, míg a kisebbekben, mint Nigériában vagy Bangladesben egymilliónál kevesebb a fejlesztői fiók.

Kérdés, mit is jelent, ha egy országban hirtelen emelkedni kezd a szám. Egyrészt azt, hogy erősödik a techszektor, másrészt csökkenő munkaerőszámot, és a fejlesztők nyilvános adattárakon történő ingyenes munkáját, mert a fizetősek eltűntek. Bármelyik eset fennállhat, és országról országra is változhat a helyzet.

Ugyanakkor a kiemelt országok esetében több más adat szintén a techszektor növekedését támasztja alá. Bangladesben például emelkedett a GDP, több fiatal életében először fér hozzá digitális eszközökhöz, nő az IT-szektor és a benne lévő cégek is beindulnak. Adalékként: az országban 180 millióan élnek, 90 millió a huszonöt év alatti.

A GPT-4 majdnem mindent visz a chatbotok versenyén, de nem ez a lényeg

Az LMSYS Chatbot Aréna Ranglistájának megállapításánál névtelenül állnak egymással szemben a modellek, és „prompt-készítők” döntik el, melyik adott jobb választ. Legutóbb a Google Bard Gemini Pro feljött a harmadik helyre, közel is került az OpenAI GPT-4 legújabb változatához. (A második a GPT-4 egy korábbi verziója.)

A nyílt forrású francia Mixtral-8x7b-Instruct a tizenegyedik helyezett GPT-3.5-Turboval versenyképes, ami nagyon jó hír az open source AI-nak, ráadásul egyre több kisebb csapat, a Mistralhoz hasonlóan, rendelkezik az alapmodellek gyakoroltatásához szükséges technológiai kapacitással. 2024-ben sok új „versenyzőre” számíthatunk.

chatbotok0.jpg

A gyakoroltatásukhoz szükséges ismeretek, tudás terjedésével, egyszerűsödik nagy nyelvmodellek (LLM) építése. Tavaly több LLM-technológia mozdult el az árucikké válás felé, és ha a trend folytatódik, vajon kik lesznek a győztesek és a vesztesek?

A Llama nyílt forrásúvá tételével a Meta sokat tett a stratégiai térkép átalakulásáért. A techóriás versenytársakkal ellentétben, abból csinálnak pénzt, hogy a felhasználók hirdetéseket látnak. LLM API hívásokat értékesítő felhőszolgáltatást viszont nem üzemeltetnek.

chatbotok.jpg

A céget súlyosan érinti, hogy az iOS-től és az Androidtól egyaránt erősen függ, azaz a hirdetések pontos targetálását akadályozó adatvédelmi szempontok érvényesítésével az Apple és a Google is tud ártani Zuckerbergék bizniszének.

Ez a függés a nyílt és viszonylag nyílt platformok támogatására ösztönzi őket. A platformokra lehet építkezni, és így világos, miért van értelme annak, hogy a Llama nyílt forrású. A következmények (új modellek) bíztatóak az MI-fejlesztő közösségre nézve.

A Google Cloud és a Microsoft Azure a piacot domináló, felhőajánlataikhoz szorosan kapcsolódó, zárt LLM-ekből tud nagy bevételeket generálni. Ez a két felhőszolgáltatás, valamint az Amazon Web Service (AWS) LLM API hívásokból remekül ki tudja egészíteni a magából a felhőből befolyó (egyébként tetemes) összegeket. De az üzlet még akkor is menne, ha nem kínálnának exkluzív, piacvezető LLM-eket, mint a GPT-4, a Gemini és utódaik. Ha az LLM árucikk lesz, mindegyik újat integrálják, és az API ajánlatokkal is óriásit kaszálnak.

Az LLM-ek különféleképpen integrálhatók a vállalatok már meglévő termékkínálatába. A Microsoft szoftverek céges értékesítéséből komoly bevételre tesz szert, amiben az LLM kiegészíti az eddigieket, hozzájuk tesz. A Google esetében más a helyzet, mert az LLM-ek inkább helyettesíthetik, mint kiegészíthetik a webes keresést. Ebből a szempontból nagyon érdekes lesz a Bard/Gemini további sorsa. A Meta szintén profitál belőlük, egyelőre elsősorban hirdetésekkel.

A techóriások akár dollármilliárdokat befektethetnek, hogy lássák: LLM-jük árucikk lesz, vagy sem. A startupoknak viszont túl kell élni, szerencsére egyeseket azonban olyan szinten támogatnak már, hogy ők is nyugodtan kísérletezgethetnek.

A versennyel minden alkalmazásfejlesztő jól jár, a sok befektetéssel és kísérletezéssel törvényszerűen javul az LLM-technológia.

A Big Tech kinyírja az újságírást?

A megszűnő sajtótermékek, az elbocsátások, a változó technológiai környezet, a Big Tech nyomulása, a hírek igazságtartalmába vetett, fokozatosan csökkenő bizalom, a dezinformáció drasztikus térnyerése, a mesterséges intelligencia generatív forradalma miatt az újságírás jövője most bizonytalanabb, mint volt valaha.

Jim Albrecht 2023-ig a Google hírökoszisztéma-termékek igazgatójaként dolgozott, tehát belülről ismeri a területet. Egy nemrégi cikkében írta, hogy a generatív MI alapjaiban írja át az újságírást, médiatartalmak fogyasztását.

Az internet elterjedése óta a médiaipar és a Big Tech folyamatosan keresési eredményeken, kompenzációs modelleken veszekedett, a sajtó közben néha még úgy is tett, mintha ők nem is lennének online, és nem használnák ki a világháló előnyeit. Az MI-vel azonban gyökeresen új helyzet állt elő: a generatív modellek képesek  átfogalmazni és közölni híreket, úgyhogy a korábbi viták lassan értelmüket vesztik.

bigtech.jpg

Miközben a kiadók civakodtak az infokom-óriásokkal, a nagy nyelvmodellek (LLM) csendben, de elképesztő tempóban fejlődtek. Az új technológiának köszönhetően belépünk abba a digitális világba, amelyben platformoknak nem kell már híroldalakra hivatkozniuk, mert egyszerűen átvehetik a híreket – magyarázza Albrecht. Van rá MI-algoritmusuk, chatbotjuk, ami átírja, és saját termékek között publikálja az információt.

A chatbotok a fogyasztók hírkereső és -értelmező eszközeivé válnak, így pedig a kompenzáció és az algoritmikus változtatások miatt értelmetlen bármit is tenni, mert az olvasók már egyáltalán nem érzik szükségét, hogy a kiadók oldalára látogassanak.

A médiaipar jelenlegi bevételi modellje nemcsak a feje tetejére állt, hanem össze is tört. Holott ez csak a kezdet. A mesterséges intelligencia által dominált média-ökoszisztémában például ki fog az információ felett döntőbíráskodni?

Albrecht gondolatai kapcsolódnak a New York Times OpenAI elleni – nyilvánvalóan évekig eltartó – peréhez, amelynek ítélete mind a hagyományos, mind az MI-sajtó számára precedensértékű lesz, fontos következményekkel. A NYT szerint az OpenAI az újság anyagait – zsurnalizmusát – használva hozott létre kompetitív terméket, az OpenAI nem így látja.

A csúcstechnológiák és főként az MI jóvoltából a Big Tech médiaszerepe is teljesen megváltozott. Platformjaik (Facebook, Google stb.) a tartalomlopás-vádakat eddig azzal hárították el, hogy csak segítenek a sajtónak a hírek terjesztésében. Ma viszont appjaiknak köszönhetően hirtelen tartalomgyártóvá váltak, pedig jelenlegi formájában az MI nem elég fejlett megbízhatóan szolgáltatni hiteles híreket, információkat. De ne legyenek kétségeink: a Big Tech át fogja venni ezt a szerepet.

A jövő médiaközegében különböző MI-ágensek kommunikálnak egymással és a felhasználókkal. Minden újság és hírügynökség saját chatbottal rendelkezik, a chatbotok saját, hihetetlen mértékben személyre szabott, kvázi alteregó MI-asszisztensünkkel érintkeznek, az infók pedig ezeken az asszisztenseken keresztül jutnak el hozzánk. Nemcsak az asszisztens, hanem az általunk fogyasztott hírek is abszolút a személyünkre lesznek szabva.

A digitális hírgazdaság új világának nyilván meglesznek a maga egyelőre megjósolhatatlan előnyei és kockázatai. Kérdés, mi marad meg a média ma ismert formájából.

Multinacionális vállalat alkalmazottját mélyhamisítvánnyal úgy átvágták, hogy huszonötmillió dollárt utalt tizenöt számlára

A hongkongi rendőrség közleménye alapján csalók kétszázmillió hongkongi dollárt (25,6 millió USD) fizettettek ki egy multinacionális vállalat pénzügyi alkalmazottjával. Mélyhamisítvány (deepfake) technológiát használva, több-résztvevős videókonferencia-híváson a cég pénzügyi igazgatója utasította az illetőt az összeg tizenöt számlára történő utalására.

Az alkalmazott meg volt győződve, hogy a vezetőséggel találkozik az online térben, csakhogy mindegyik digitális másolat volt. Először e-mailt kapott az Egyesült Királyság-székhelyű vállalat állítólagos pénzügyi igazgatójától egy titkos tranzakció szükségességéről. Adathalászatra (phishing) gyanakodott, a videókonferencián viszont minden gyanúja eloszlott, mert a résztvevők úgy néztek ki, úgy beszéltek, mint húsvér munkatársai.

hongkongscam0.jpg

Fel sem merült benne, hogy nem valódi személyekkel beszélget, hozzá is járult az utalásokhoz.

Az eset nem egyedüli, bár ekkora összeg eltulajdonításáról eddig még nem számolt be a világmédia. Csalók nyilvánosan hozzáférhető videókat módosítanak mélyhamisítványokká, így szedve ki összegeket személyekből és szervezetekből.

hongkongscam1.jpg

A hongkongi rendőrség közölte, hogy hat személyt vett őrizetbe ilyen csalások miatt. Nyolc ellopott hongkongi személyigazolvánnyal – a tulajdonosok mindegyik elvesztését bejelentették –, 2023 júliusa és szeptembere között kilencven kölcsönkérelmet adtak be, ötvennégy bankszámlát nyitottak.

A személyi igazolványok eredeti tulajdonosait utánozva, a városban legalább húsz alkalommal MI-mélyhamisítványokkal vágtak át arcfelismerő programokat.

A kamu (digitális) pénzügyi igazgató által elkövetett csalás akkor derült ki, amikor az alkalmazott egyeztetett a vállalat központi irodájával. A hongkongi rendőrség sem az ő, sem a vállalat nevét nem árulta el, de ez a példa is igazolja, hogy a hatóságokat nem véletlenül tölti el világszerte komoly aggodalommal a mélyhamisítvány-technológia, mint például a Taylor Swiftről januárban az X-en megjelent, MI generálta, tízmilliók által megtekintett kamu szexképek.

Mit tanulhat a mesterséges intelligencia egy csecsemőtől?

Csecsemők velük született adottságaik miatt értik a világunkat irányító fizikát, új fogalmakat és a nyelvet akkor is gyorsan megtanulják, ha korlátozott információ áll rendelkezésükre.

Még a mai legfejlettebb mesterségesintelligencia-rendszereknek sincsenek meg ezek a képességeik. A nyelvmodellek jól előrejelzik egy mondat következő szavát, de semmi közeli nincs bennük a csecsemők „józan eszéhez” (common sense).

csecsemok_ai.jpg

De mi lenne, ha úgy tanulnának, mint a csecsemők?

A mai modelleket irdatlan adatkészleteken gyakoroltatják. A New York Egyetem kutatóit érdekelte, mit tudnak ezek a modellek, ha sokkal kisebb adatkészleteken, a beszélni tanuló gyerek által megtapasztalt látványokon és hangokon trenírozzák őket. Legnagyobb meglepetésükre, az MI egy érdeklődő csecsemő, Sam jóvoltából sokat tanult. Kamerát tettek a fiúcska fejére, hathónapos korától második születésnapjáig hordta. Az általa rögzített anyagból a kutatók rájöttek, hogyan tanítsák meg egy ideghálónak, hogy a szavakat az általuk reprezentált objektumokhoz társítsák.

csecsemok_ai0.jpg

A csecsemők évek óta inspirálják a gépitanulás-kutatókat. Pontos megfigyelők, kiváló tanulók, például próba-hiba módszerrel ismerik meg jobban a világot, pallérozódik az elméjük. Tudják, hogy a labda akkor is megvan, ha eldugják előlük, hogy szilárd, nem változtatja meg egyhamar a formáját, folyamatos „útvonalon” halad, hirtelen nem lehet mindenhova eljuttatni.

A Google DeepMind kutatói igyekeztek egy MI-rendszernek megtanítani az „intuitív fizika” érzékét. A modell egyedi pixelek helyett videókon látható objektumokra összpontosítva tanulta meg, hogyan mozognak dolgok. Többszázezer videón trenírozták. Ha egy csecsemő meglepődik, amikor a labda hirtelen kirepül az ablakon, azért van, mert a tárgy mozgása nem passzol a gyerek fizika-értelmezéséhez. A Google DeepMind kutatói elérték, hogy az MI is meglepődjön, ha egy tárgy az általa megtanulttól eltérő módon mozgott.

Yann LeCun, a Meta MI-főnöke szerint a mesterséges intelligencia megtanítása a világ gyerekekéhez hasonló megfigyelésére, az intelligensebb gépek felé vezető újabb fontos lépés. Az ember agyában világmodellként szimulálja a világot, tudunk intuitívan háromdimenziós jellegéről, és hogy a tárgyak nem tűnnek el, amikor nincsenek a látómezőnkben. Így következtetünk a labda vagy a bicikli pár másodpercen belüli térbeli pozíciójára.

Az MI-ből hiányzik – még – ez a józanész-bölcsesség. Csecsemőket figyelve, képesek lehetnek elsajátítani. 

Időseket segítő robotokat terveztek Katalóniában

A több európai és közép-keleti egyetemmel együttműködő barcelonai PAL Robotics nyolc robotból álló „gyűjteménye” sikeresen átment a betegekkel való első teszteken.

SPRING nevük tavaszt is, rugót is jelent, ezúttal viszont a Socially Assistive Robots in Gerontological Healthcare (Szociálisan segítő robotok a gerontológiai egészségügyben) rövidítése. Rendeltetésük, hogy kényelemérzetet biztosítsanak idős pácienseknek, enyhítsék/megszüntessék a bennük dolgozó feszültséget, miközben az ápolószemélyzetre nehezedő terheket is csökkentik a forgalmas és eseménydús környezetben.

robot_korhazak.jpg

A fejlesztők reményei szerint a SPRING projekt mérföldkő lehet az interaktív robotikai fejlesztésekben, büszkék is eddigi munkájukra, ugyanakkor elismerik: komoly és izgalmas kihívásokat kell még megoldaniuk.

A teszteken kiderült, hogy a robotok képesek elvégezni rutinfeladatokat: párizsi közkórházakban üdvözölték a betegeket, megmondták nekik, merre menjenek, kérdéseikre válaszoltak.

Csoportos beszélgetéseket is megértettek, és a betegek által hozzájuk intézett kérdések alapján segítséget is nyújtottak nekik. Ez az előrelépés a nagy nyelvmodellek (LLM), azaz a ChatGPT-szerű generatív mesterséges intelligencia utóbbi években tapasztalt dinamikus fejlődésének köszönhető.

A robotok használatával az egészségügyi dolgozók és a páciensek közötti fizikai kontaktus mennyisége is csökkent. Ha kevesebb az érintkezés, kevesebb a fertőzés, és így a gépek közrejátszhatnak kórházi környezetben gyakori és gyors terjedésük megakadályozásában.

A projekt négy és fél éve indult, az EU Horizon 2020 kutatási-innovációs kezdeményezése finanszírozta. Közelebb kerültünk vele a robotika egészségügyi alkalmazásainak két alapvető céljához, hogy a gépek észrevétlenül, gördülékenyen dolgozzanak együtt a személyzettel, valamint javítsák a betegek hangulatát, elfogadhatóbbá tegyék számukra a kórházban átélteket.

süti beállítások módosítása