Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Szupertelefon az analfabetizmus ellen

2022. szeptember 16. - ferenck

A hanggal működtetett okostelefonokkal nagyon fontos, és eddig többé-kevésbé figyelmen kívül hagyott réteget céloznak meg Afrika Szaharától délre fekvő részein – több tízmillió személyt, akik nem tudnak írni, olvasni.

A helyileg fejlesztett és összeszerelt, 92 dolláros elefántcsontparti Szuperfon hangasszisztenssel működik, az reagál az utasításokra. A készüléket azért tervezték, hogy az érintettek a hétköznapi feladatokat kivitelezhetőbbnek érezzék, jobban megértsenek dokumentumokat, eredményesebben kommunikáljanak kormányzati ügynökségekkel, tudják kezelni a bankszámlájukat. Elefántcsontpart kb. negyven százaléka analfabéta.

Szintén fontos szempont, hogy ezek a személyek leküzdjék a csúcstechnológiákkal szembeni előítéleteiket, frusztrációikat.

superphone.jpg

A Ceco cég termékének használója tizenhét helyi és ötven, más afrikai országban beszélt nyelv közül választhat. A fejlesztők ezer fölé szeretnék növelni a nyelvek számát, amellyel a kontinens felét lefednék. Munkájukat mintegy háromezer önkéntes támogatja.

„Sok szervezetnél elsődleges cél az analfabéták megtanítása az írásra-olvasásra, és csak utána jön a technológia, mert ahhoz mindkettőt pontosan kell használni. Mi kihagyjuk az írást-olvasást, és egyből be akarjuk őket kapcsolni a gazdasági és a társadalmi életbe” – nyilatkozta Alain Capo-Chichi, a Ceco benini elnöke.

Az ENSZ 2016-os, utolsó ilyen felmérése alapján, a világ 750 millió felnőtt analfabétájának 27 százaléka Afrika Szaharától délre fekvő részein él. A kontinensen közel kétezer nyelvet beszélnek, egyiket-másikat több tízmillióan, és nemcsak egymás között, hanem más etnikumokkal is azon kommunikálnak.  Egyes nyelvek viszont lényegében csak szűk közösségekben használt dialektusok.

Az alacsony számok és/vagy a gazdasági befolyás hiánya miatt a fejlesztők általában figyelmen kívül hagyják ezeket a kis nyelveket, míg másokra már dolgoztak ki hangasszisztens-alapú megoldásokat. A Ceco nincs egyedül, a ghánai Mobobi például a helyi twi nyelvre fejlesztett asszisztenst (Abena AI), míg a Mozilla a Kelet-Afrikában közel százmillió személy által beszélt szuahélira dolgoz ki hasonló megoldást.

Egyes helyi telekommunikációs szakértők szerint viszont nincs szükség asszisztensekre, mert egyes alkalmazások, például a WhatsApp hangüzenet-szolgáltatása megoldja a problémák zömét. Új telefon helyett bármilyen okostelefonra telepíthető szoftverek kellenének, helyi nyelvekkel – vélik.

Hogyan várják boldog zöldségek a vacsorát?

Hogyan generáljunk szuperszámítógép nélkül, közönséges grafikus kártyával másodpercek alatt szövegből képet, például hogyan „várják boldog zöldségek a vacsorát?”

A kérdés kicsit sci-finek (másrészt bugyutának) hangzik, pedig nem az, mert a Müncheni Ludwig-Maximilian Egyetem (LMU) Stable Diffusion mesterségesintelligencia-modellje képes rá (és a vacsoraváró boldog zöldségekről is tud képet alkotni, lásd a mellékelt ábrát).

Az algoritmust a felsőoktatási intézmény Gépi Látás és Tanulás Csoportja fejlesztette.

stablediffusion.jpg

„Speciális művészi tehetséggel, számítógépes ismeretekkel és különleges hardverrel nem rendelkező laikusok számára is hatékony eszköz a számítógépes képgenerálást utasítás alapján megvalósító új modell. A modell megszünteti a hétköznapi halandók önkifejezési korlátjait” – jelentette ki a fejlesztést vezető Björn Ommer professzor.

Kívülállók mellett természetesen valódi művészek is hasznát vehetik, mert új ötleteiket pillanatok alatt képvázlatokká alakíthatják. A kutatók meg vannak győződve, hogy ezek az új, mesterségesintelligencia-alapú képalkotó eszközök kitágítják a hagyományos kreatív szoftverek, például a Photoshop adta lehetőségeket.

Ha a Photoshop jelentette a képalkotásban azt, mint a szövegszerkesztő a kézzel és írógéppel írásról a számítógépesre történő váltásban, akkor az egyre több szövegről-képre (text-to-image) alapú MI (OpenAI, Google stb.) a vizuális önkifejezés új szintjét hozza el.

Az LMU projektjét a Stability.AI startup segítette, a modellt az ő szervereiken trenírozták. Ommer elmondta, hogy a jóval több számítási kapacitás és gyakorlópélda tették megoldásukat a jelenlegi egyik legerősebb képszintézis-algoritmussá.

A modell – és az utóbbi évek több hasonló algoritmusának – specialitása, hogy hagyományos gépen is jól működik. Néhány éve még teljesen más volt a helyzet…

Ehhez annyi kellett, hogy a több milliárd gyakorlókép lényegét az MI néhány gigabájtos modellbe tömörítse. Egy ilyen algoritmus tudja, miből áll az autó, mik egy művészi stílus jellemzői stb. Ezeket a kulcstényezőket megtanulva, képes további példákat generálni.

„Nagyjából ugyanúgy, mint ahogy egy festőtanuló egy öreg mester workshopján elsajátítja, hogyan fessen a mester stílusában” – magyarázza Ommer.

A kutatók célja, hogy a számítógépek megtanuljanak látni, értsék egy adott kép tartalmát. Modelljük komoly előrelépés ebbe az irányba.

A modell a CreativeML, Open RAIL-M licenc alatt szabadon hozzáférhető.

A lottón alapuló gépi tanulás védi meg a személyiségi jogokat

Gépitanulás-modellek feladatok, például képosztályozás hatékony kivitelezésére történő begyakoroltatása többmillió, esetleg többmilliárd kép megismertetésével jár. Ekkora adatsor összegyűjtése komoly kihívásokkal jár. Egyes esetekben, például, ha személyiségi jogokról (privacy), mondjuk, orvosi képekről van szó, különösen nehéz korrekt adatsor létrehozása.

Az MIT (Massachusetts Institute of technology) és a neves felsőoktatási intézményben alapított DynamoFL startup népszerű technikával, az úgynevezett egyesített tanulással (federated learning) igyekszik megoldást találni a privacy problémára. Eddigi közös munkájukkal a tanulási módszer gyorsabbá és pontosabbá vált.

mit_privacy.jpg

Az egyesített tanulás együttműködés-alapú módszer gépitanulás-modellek gyakoroltatására. A módszerrel az érzékeny felhasználói adatok nem szivárognak ki, privát adatok maradnak.

Lényege, hogy többszáz vagy többezer felhasználó maga gyakoroltatja a saját modelljét. Saját adatokkal dolgozik a saját eszközén. Utána az összes felhasználó központi szerverre küldi a modelljét. A szerveren összekombinálják őket, a kombináltból újat hoznak létre, amelyet valamennyi felhasználónak visszaküldenek, és amely jobb, mint az eredetiek.

A FedLTN nevű modell a gépi tanulásban ismert lottószelvény-hipotézisen alapul. Lényege, hogy nagyon nagy idegháló-modellekben léteznek ugyanarra a teljesítményre képes, kisebb alhálózatok. Egy ilyen alhálózatnak a megtalálása hasonló a nyertes lottószelvény megtalálásához. (A névben lévő LTN a lottery ticket network-öt, a lottószelvény-hálózatot rövidíti.)

A FedLTN egyrészt pontosabb, másrészt kisebb a kombinált modell. Felgyorsítja a felhasználók és a központi szerver közötti kommunikációt (ami négyszer-hatszor gyorsabb lesz), miközben garanciát jelent arra, hogy minden egyes felhasználó a saját környezetéhez szabott modellt kap.

Más módszerekkel összehasonlítva, a FedLTN mérete legalább egy nagyságrenddel kisebb, mint a többié, miközben minimum tíz százalékkal pontosabb.

Cyborg-csótányok

Japán kutatók távirányítható cyborg-csótányokat alakítottak ki. A félig rovar, félig gép rendszerben az állatot parányi vezeték nélküli irányító modullal szerelték fel. A modult napelemhez kapcsolt, újratölthető elem működteti.

Annak ellenére, hogy mechanikus eszközök vannak rajta, az ultravékony elektronika és a rugalmas anyagok nem zavarják a helyváltoztatásban, sőt, lehetővé teszik az állat szabad mozgását. Ezzel pedig a cyborg rovarok praktikus célokra is használható valósággá válnak.

A hibrideket kockázatos közegek kivizsgálására, a környezet folyamatos megfigyelésére alkalmazhatják. Viszont csak akkor lesz értelme, ha működtetői hosszabb ideig távirányíthatják. Ez elsősorban a lábmozdulatok vezeték nélküli vezérlésére vonatkozik.

csotany_1.jpg

Mivel senki sem örülne egy elszabadult csótányrajnak, az elem megfelelő töltöttségi szinten tartása kritikus tényező. Akár töltőállomásról is működhetnének, viszont ha mindig vissza kellene térniük, időérzékeny munkák esetében komoly problémák merülnének fel. A kutatók ezért döntöttek a folyamatos töltöttséget biztosító, „fedélzeti” napelem mellett.

Az eszközök a hat centi hosszú madagaszkári csótányba integrálása komoly mérnöki kihívásnak bizonyult. Speciális „hátizsákot” és ultravékony napelem-modulokat, plusz megfelelő ragasztórendszert kellett kitalálni hozzá. Úgy kell működniük, hogy sokáig az állaton maradjanak, viszont minimálisan se akadályozzák a természetes helyváltoztatásban.

A vezeték nélküli lábirányító modult és a lítium-polimer elemet a csótány hátának felső részéhez rögzítették, a 3D nyomtatott hátizsák segítségével. Elérték, hogy az elektronika akár egy hónapig kitartson az állaton. A 0,004 milliméter vastag napelem-modult a hát hátsó részéhez rögzítették. Kicsi, de erős szerkezet: az élő rovarokhoz használt legkorszerűbb energiagyűjtő eszközöknél ötvenszer több energiát képes generálni.

Az eszközök elhelyezése, a pontos hely kiválasztása szintén kulcsfontosságú volt, mert máskülönben a rovar nem tudna mozogni. A kivitelezés előtt rengeteg csótány mozgását tanulmányozva döntöttek. Végül a lábmozgást stimuláló miniatűr drótokat is az állathoz rögzítettek.

A cyborgot letesztelték, az elemet napfényutánzattal töltötték fel harminc perces működésre, a távirányított állat jobbra és balra fordult. Megállapították, hogy a jövőben még flexibilisebb anyagokat használnak.

Csótányok után más rovarok, egyes bogarak, vagy repülő rovarok, például kabócák is sorra kerülhetnek.

Maszkon keresztül is olvas a szájról a következőgenerációs hallókészülék

Egy, a Glasgow Egyetem kutatói által vezetett nemzetközi csapat maszkot viselő beszélők szájáról is olvasó rendszert fejlesztett. Munkájuk a következőgenerációs hallókészülékeket vetíti előre.

Ma a világ lakosságának öt százaléka, kb. 430 millió személy visel a hallását segítő technológiát. Ezek a megoldások sok szempontból hasznosak, az újak széles spektrumon gyűjtik, majd a hang módosításával felerősítik az adatokat.

hallokeszulek.jpg

A Glasgow-i fejlesztés a rádiófrekvenciás érzékelés és mesterséges intelligencia kombinációja; a kettőt együtt most használják először ajakmozgások azonosítására. Ha a rendszert hagyományos technológiába integrálják, kezelni tudja azok egyik buktatóját, az úgynevezett koktélparti effektust.

A készülékek a környezeti zajok felerősítésével segítik viselőjüket. Ha viszont túl nagy a zaj, például egy koktélpartin, az erősítés olyan széles spektrumon történik, hogy nagyon nehéz speciális hangokra, például egy adott személyre összpontosítani.

hallokeszulek0.jpg

Az intelligens hallókészülék, a hagyományos darab és az erősítés pluszadatokat gyűjtő második eszközzel való kiegészítése. Ez az eszköz kamera is lehet, és a videoanyag segíthet, viszont személyiségi jogi (privacy) problémákat vet fel, ráadásul a maszkon keresztüli „beszédolvasás” így sem megy.

Mivel csak rádiófrekvenciás adatokkal dolgozik, videofelvételekkel viszont nem, az új technológia nem sérti meg a személyiségi jogokat.

A fejlesztésben önkéntesek is részt vettek, a kutatók férfiakat és nőket kértek meg az angol nyelv öt magánhangzójának (a, e, i, o, u) maszk nélküli és maszkos, többszöri kiejtésére. Arcukat rádiófrekvenciás jelekkel, radarérzékelő és wifi adó közreműködésével, illetve ajakmozgás nélkül is leszkennelték. Az arcok így nem azonosíthatók be.

Az összegyűjtött 3600 adatmintával gépi tanulás- és mélytanulás-algoritmusokat gyakoroltattak a magánhangzókhoz kapcsolódó jellegzetes ajak- és szájmozgások felismeréséhez. Mivel a rádiófrekvenciás jelek könnyedén „átmennek a maszkon”, az algoritmusok álarcot viselő személyek hangképzését is képesek „olvasni.”

A rendszer jól teljesített a teszteken. Wifi esetében maszk nélkül 95, maszkkal 80 százalékos pontossággal dolgozott. A radaradatokat maszk nélkül 91, maszkkal 83 százalékban azonosította.

Az új kutyakövető rendszerrel mindig tudjuk, hol van a házi kedvenc

A pandémia alatt több időt tölthettünk kutyáinkkal, macskáinkkal, de az irodák megnyitásával ismét kevesebbet vagyunk velük, hacsak nem visszük őket munkahelyünkre.

De mi történik, ha tudni akarjuk, mit is tesznek pontosan? Sajnos hiába léteznek állatkamerák, minden helyiségben fel kellene szerelni azokat, és a felvételek visszanézése nélkül nem igazán lenne elképzelésünk arról, mit is csinálnak valójában.

A Georgia Technológiai Intézet (Georgia Tech) kutatói változtatni kívántak ezen a helyzeten, és különleges eszközt fejlesztettek.

kutyak.jpg

A különféle érzékelőket használó PetTrack megadja az állat valósidejű bel-, vagy kültéri tartózkodási helyét. Az ultra-szélessávú (UWB) rádiós vezeték nélküli szenzorok lokalizálják, a gyorsulásmérők pedig megmondják, hogy ül, fekszik vagy mozog. Sem a tárgyak, sem a falak nem jelentenek akadályt, az eszköz informatívabb, mint egy kamera, vagy egy GPS. Használata könnyű, nyakörvre kell felszerelni.

Két részből áll: az egyik lokalizálja az állatot, a másik igyekszik megérteni a tevékenységét. A szenzorok kombinációja teszi különlegessé, és különbözteti meg a hasonló szerkezetektől.

A rádiós érzékelővel akár harminc méterről tudjuk, hogy hol van, míg a gyorsulásmérő az elhelyezkedését, pozícióit monitorozza. Megnyugtató eszköz, mert rögtön informálva vagyunk, ha például az állat tiltott helyen tartózkodik. Beteg és idős kedvencek esetében különösen hasznos.

Az UWB-hálózat „dugd be és használd” (plug-and-play) alapon működik, nincs interferencia a meglévő wifi rendszerekkel, viszont rá kell csatlakoztatni az otthonira, máskülönben nem frissül, és nem tudja tájékoztatni a gazdit.

A PetTrack kicsi és abszolút biztonságos. A hálózat csak ott funkcionál, ahol telepítve van, így hackerek – ellentétben a kamerákkal – nem tudnak mit kezdeni vele (hacsak nincsenek ők is ott, ami nem valószínű).

A fejlesztők tovább szeretnék bővíteni az eszköz funkcióit, és akkor valóban a jövő házi kedvenceket figyelő csúcsmegoldásává válhat, de kutyák kiképzésében is segíthet, és persze még erősebbé teszi a gazdi-állat kapcsolatot.

Életszerűbbek lesznek a vezetés-szimulációk

A jelenlegi vezetés-szimulációk nem elég realisták, nem élethűek, és ez különösen a háttérben lévő objektumokra, például fákra, útjelzésekre érvényes. Az Ohio Állami Egyetem kutatói e problémára reagálva, új módszert dolgoztak ki szimulátorok által használt fotorealisztikus képek alkotására.

Az önvezető autók tesztelése sokat javulhat az új szimulációval.

A hagyományos számítógépes grafika részletes modelleket, rácshálókat és textúrákat használ 2D-s képek 3D-ssé alakításához. A folyamat egyrészt nagyon munkaigényes, másrészt a képek nem mindig meggyőzőek.

driving_simulation.jpg

Generatív ellenséges hálózatokkal (GAN) az ohiói kutatók úgy gyakoroltatták a programjukat, hogy véletlenszerűen generáljon élethű, hihető környezeteket. Ez különösen akkor fontos, ha önvezető járműben ülő személyek reakcióit, éberségi állapotát stb. tesztelik.

Az eddigi vezetés-szimulációk inkább számítógépes játékokra emlékeztetnek, így szinte senki nem veszi komolyan őket. Az új élethűbb tárgyaival viszont változást hozhat.

A nyílt forrású CARLA szimulátorból indultak ki, GAN-alapú képszintetizátorral dolgozták ki a hátteret: épületeket, növényzetet, égboltot stb. Ezeket a tárgyi elemeket hagyományosan renderelt objektumokkal kombinálták össze.

A hagyományos eljárás az elsődlegesen fontos elemek, például közeli járművek esetében kihagyhatatlan, a mesterséges intelligencia (GAN) viszont háttereknél és előtereknél jobban működik. Való világbeli adatokat használva dolgoz ki realisztikus megoldásokat.

Ehhez persze környezeti mintázatokat kell felismernie, amelyet tanulás útján el is sajátított, máskülönben nem tudna mit kezdeni autókkal, fákkal, árnyékokkal. A mintázatokat és a textúrákat azonban nem mérnökök tervezték, hanem sablonok alapján maga az MI.

Kiderült, hogy a jelenetek fotorealizmusa sokat javult, viszont nem egyszerre, hanem képkockánként módosították a szimulációt. Csakhogy mi nem képkockáról képkockára élünk, és az egész csak akkor lesz konzisztens, ha a felhasználó folyamatosnak, gördülékenynek érzi.

A kutatók pont ezen dolgoznak most.

Vízalatti kommunikáció okostelefonok között

Évente sokmillióan sznorkeleznek és búvárkódnak. Víz alatt tartózkodó más személyekkel egyelőre a kézjelekkel történő kommunikáció az egyetlen biztonságos és közvetlen érintkezési lehetőségük. A rekreációs céllal ott lévők kb. 20, a profik, például hivatásos búvárok mintegy 200 jelet használnak. Ezekkel értesítenek másokat az oxigénszintről, vízi állatok közelségéről, illetve segítik egymást feladatok elvégzésében.

Mivel a jelek vizuálisak, hatékonyságuk a távolságtól és a látási viszonyoktól függ. A kétirányú szöveges kommunikáció is alternatíva, eddig azonban csak egyedire kialakított, drága és nehezen beszerezhető hardverrel működött.

viz_alatt.jpg

A Washington Egyetem kutatói bemutatták, hogy a ma már többmilliárd okostelefonnal, okosórával is megvalósítható a kommunikáció. AquaAppjuk az első mobil alkalmazás a vízalatti érintkezésre, hálózatépítésre.

Az okostelefonok wifi és bluetooth kommunikáción alapulnak, amelyek nem hatékonyak víz alatt. Az AquaApp az okostelefonok és okosórák hangszóróját és mikrofonját használja. Csak az alkalmazást kell letölteni, és vízhatlan telefontok kell hozzá. A tokoknál nem mindegy a mélység, célszerűbb minél mélyebben is használhatót beszerezni.

Az interfész segítségével a felhasználó a kézjelzéseknek megfelelő 240 előre kiválogatott üzenet közül választhat, de a 20 egyszerűt külön kiemelték, hogy könnyen hozzájuk férhessünk. Az üzeneteket nyolc kategória (irány, környezeti tényezők, felszerelés állapota stb.) alapján szűrhetjük.

viz_alatt0.jpg

A fejlesztőknek szárazföldön és a légtérben nem ismert technikai kihívásokat kellett megoldaniuk: a jelerősség ingadozását a part, a tengerfenék, a vízfelület, közeli személyek és tárgyak okozzák; a mikrofonok és hangszórók okostelefon-típusokként változnak stb. Az appnak valósidőben kell alkalmazkodnia ezekhez. Ráadásul a készülékek elhelyezkedése, másokhoz való közelsége szintén gyorsan változik, plusz az alkalmazás sokféle (hajók, csónakok, repülők stb. által okozott) zajprofillal szembesülhet.

Az appot minden egyes üzenetküldésre valósidőben optimalizáló algoritmusokat fejlesztettek. Ha el akarunk küldeni egy üzenetet, először előzetest juttat el a fogadónak, akinek a készülékén az alkalmazás lefuttat egy algoritmust, amely meghatározza, hogy az illető a legjobb körülmények között kapja meg. Utána elküldhetjük az igazi üzenetet.

Hálózati protokollt is dolgoztak ki, amellyel megoszthatjuk a hozzáférést. Akár 60 egyedi felhasználó is rákapcsolódhat.

Az alkalmazást féltucat, különböző feltételeket biztosító helyszínen tesztelték, és kiderült: 113 méter távolságig, 12 méter mélységig működik, de üzenetküldésre a maximum 30, segélykérő jeladásra 100 méter az ideális. Ennyi szinte az összes lehetséges forgatókönyvre elég.

Figyelték az energiahasználatot is, ami négy óra alatt 32 százalék volt egy Samsung Galaxy S9 készüléken. Rekreációs célú búvárkodásra ez a maximális ajánlott időtartam.

Vízalatti kommunikáció a tömegeknek – vélik a fejlesztők.

A vízalatti hálózatiság viszont egyelőre ott tart, mint az internet az 1970-es években, az ARPANET korában. Az AquaAppban benne van a lehetőség, hogy gyorsan megváltoztassa a mostani állapotokat.

Egyre masszívabbak Kína mesterségesintelligencia-befektetései

2017-ben a kínai vezetés bejelentette, hogy 2030-ra az ország a világ elsőszámú mesterséges intelligencia innovációs központjává kíván válni. Az azóta eltelt időszakban az MI kutatások és fejlesztések felpörögtek, megsokasodtak az ezeken a területeken létrehozott termékek.

A legfrissebb MI Index szerint a távol-keleti ország adja a földkerekség MI magánbefektetéseinek egyötödét.

Ennek ellenére nem minden rózsás a kínai technológiai szektorban. A kockázati tőkebefektetés 2022 első négy hónapjában 43,5 százalékkal alacsonyabb volt, mint 2021 azonos periódusában. A csökkenés négyszer nagyobb, mint a világátlag.

chinaai.jpg

Az ezévi negatív számok ellenére, a McKinsey tanácsadó cég előrejelzése alapján 2030-ra az MI vizsgált ágazatai 600 milliárd dollárral növelik az ország gazdaságát. A kutatók 2021. októberi és novemberi piaci adatokat elemeztek, és ötvennél több szakértővel készítettek interjút.

A „piacra kész” (és nem a korai szakaszban lévő, illetve a már beérett) MI technológiákra – és alkalmazási területeikre – összpontosítottak, azok valószínűsíthető legnagyobb hatását vizsgálták. Kiderült, hogy ezek közül a szállítás, a gyártás, a vállalatiszoftver-fejlesztés és az egészségügy járul hozzá leginkább az ország gazdasági növekedéséhez.

chinaai0.jpg

A járműipari és logisztikai hasznosulásokat is tartalmazó szállítás 64 százalékot tesz ki ebből. Az önvezető autók 335 milliárd dollárt generálnak, és ebbe beleértik a használatukkal járó kevesebb balesetet, a mentőkre és a kórházi kezelésre költött kisebb összegeket is. Az MI lehetővé teszi a járműflották hatékonyabb kezelését és az eredményesebb útvonal-tervezést is.

A gyártás 19 százalékot jelent. A legnagyobb, százmilliárdos tételt a hatékonyságot és a termelékenységet növelő innováció, például összeszerelő robotok és a dolgozókat monitorozó viselhető technológiák adják.

Vállalati szoftverek fejlesztése 13 százalékot generál. Alig több mint a fele felhőmegoldásokra és MI programokra, a maradék pedig a szoftverre, mint szolgáltatásra (software as a service, SAAS) vonatkozik.

Az egészségügyi MI a gyógyszerfejlesztésben, klinikai tesztekben, beteggondozásban és más alkalmazásokban segít. Ez teszi ki a maradék négy százalékot, kb. 25 milliárd dollárt.

Persze ez még nem minden, mert tényleg bámulatos a fejlődés, viszont egyes problémák – csúcsminőségű adatok használata, szellemi tulajdonjogok védelme, értő munkaerő képzése – megoldásával többet kellene foglalkozniuk a kínai szakembereknek.

Hogyan ismerjük fel a félrevezető információt?

A tényellenőrök nem tudják tartani a tempót az egyre nagyobb mértékű félretájékoztatással, dezinformációval, és a mesterséges intelligencia sem teljesít jól online tartalmak moderálásában.

A Facebook algoritmusai például csökkentik a fogyatékkal élőknek készült hirdetések számát, ugyanakkor gyakran szemet hunynak az erőszakra való buzdítás felett. Úgy tűnik, hogy a lépésről lépésre történő fejlesztésekkel mégis tehetünk valamit az oltásellenes hangok, a klímakatasztrófa tagadása és más káros online tartalmak terjedése ellen.

misinformation.jpg

A webet elömlesztő hamis információkra reagálva, a Google frissítette a keresési eredményeket rangsoroló algoritmus mögötti egyik fontos modellt. A módosításokkal el akarják érni, hogy csökkenjen a keresési eredmények tetejéhez közeli dezinformáció. Apró, de fontos részletekről, információdarabkákról, kivonatokról (snippets) van szó.

A Google kutatói az úgynevezett Többfeladatos Egyesített Modell felülvizsgálatával igyekeznek ellenőrizni a részletek pontosságát.

misinformation0.jpg

A modell kiértékeli, hogy a legjobb eredmények mennyire egyeznek. Még akkor is képes összehasonlítani oldalakat egy adott témában, ha azok különböző mondatokat és példákat használnak. Ha különösebben nem bízik a rendelkezésre álló forrásokban, kivonat helyett figyelmeztetést generál, például: „úgy tűnik, nincs sok nagyon jó találat ehhez a kereséshez.”

A félrevezető kérdéseket szintén felismeri. Például az olyanokat, hogy „mikor ölte meg Snoopy Dog Abraham Lincolnt?” A frissítés máris hasznosnak bizonyult, mert negyven százalékkal csökkent az ilyen lekérdezésekre adott hibás információdarabok száma.

misinformation1.jpg

A Google nem az egyetlen infokom nagyvállalat, amelyik mesterséges intelligenciával próbálja szűrni a dezinformációáradatot. A Facebook multimodális tanulással igyekszik detektálni a Covid-19-cel kapcsolatos hamis állításokat. A YouTube 2020 óta használ az összeesküvéselméleteket és a tudományellenes félretájékoztatást tartalmazó videók ajánlásait leminősítő osztályozót.

Az MI összességében hasznos eszköz a keresési eredmények és maguk a keresők hitelességének megőrzésében, de egyedül nem tud megbirkózni a feladattal. Nagyjából úgy, mint ahogy az önvezető taxikkal dolgozó vállalatok is alkalmaznak (helyszíni vagy távirányító) humán sofőröket.

Az automatizált tartalommoderáló rendszereknek egyelőre komoly segítséget jelent, ha ember is van a közelükben.

süti beállítások módosítása