Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Mesterséges intelligencia csökkentheti a HIV-fertőzést

2021. február 26. - ferenck

A Covid-19 miatt hajlamosak vagyunk megfeledkezni más betegségekről, járványokról, holott sajnos nem tűntek el, és a tudomány ugyanúgy küzd ellenük, mint eddig.

Egészségügyi szakembereket régóta foglalkoztatja a sokszor nehezen megválaszolható kérdés, hogy a fontos információ hogyan jusson el azokhoz a személyekhez, akiknek a legnagyobb szükségük van rá. A Harvard, a Dél-kaliforniai és a Pennsylvaniai Állami Egyetem kutatói ebből a célból fejlesztettek mesterségesintelligencia-rendszert, amellyel a HIV-fertőzés terjedését vizsgálták az egyik legkockázatosabb csoporton belül, a fiatal hajléktalanok körében.

A vizsgálat azért volt fontos, mert a hajléktalan fiatalok tízszer nagyobb valószínűséggel fertőződnek meg, mint a stabil lakhatási körülmények között élők.

hiv_ai.jpg

Szociális munkások és közegészségügyi szakemberek a megelőzéshez, viselkedésformák népszerűsítéséhez sokszor dolgoznak együtt a közösségen belüli legnagyobb hatást kiváltó vezetőkkel. De miként választhatók ki az illető személyek?

Ezen a ponton kapcsolódik be az MI. Hálózatkutatók évtizedek óta vizsgálják, hogy korlátozott számú csomóponttal hogyan lehet a legeredményesebben terjeszteni az információt (mint ahogy a fentebbi ábra is igyekszik illusztrálni, ha nem is sikerül neki teljesen). A projekt részeként fejlesztett mesterséges intelligencia a csomópontok, tehát a vezetők azonosításával oldotta meg a problémát.

Terepen, szociális munkásokkal és több mint 700 hajléktalan személlyel együtt dolgozva, az algoritmus jelentősen csökkentette a HIV-fertőzés kockázatát. Mivel nem mindig a közösség legnépszerűbb személyei rendelkeznek a legtöbb hálózati kapcsolattal, a kiválasztás nem a népszerűség, hanem a kapcsolatok száma alapján történt, azaz kiknek van a legtöbb kontaktja a közösségen belüli különböző csoportokban.

Feltérképezték az érintett hajléktalan fiatalok hálózatait, majd az algoritmus a hálózatklaszterek legváltozatosabb kapcsolatrendszereit átfésülve találta meg a keresett személyeket, akik HIV-felvilágosító tréningen vettek részt, utána pedig a közösségen belül népszerűsítették a szükséges óvintézkedéseket.

A kutatók stratégiája, a CHANGE (magyarul változás, egyébként az „átfogó adaptív hálózati mintavétel a közösségi befolyásért”, CompreHensive Adaptive Network samplinG for social influencE rövidítése) működött: a kiválasztott személyek felvilágosító kampányának hatására a közösség tagjai kevesebb kockázatot vállaltak, az egyhónapos megfigyelés alatt megváltozott az attitűdjük. Fontos tényező, hogy ezek a csoportok („populációk”) mindig ideiglenesek – sok tagjuk az adott időtartam vége, jelen esetben összesen három hónap letelte előtt távozott, viszont újak is érkeztek.

A projekt nagy újdonsága, hogy közösségek fizikai hálózatába történő egészségügyi célú beavatkozást most optimalizáltak először mesterséges intelligenciával. Az MI-használatból sokan levonhatják az általános következtetéseket, és hasonló megoldásokat alkalmazhatnak például táplálkozási, drogfogyasztási és a legvédetlenebb rétegeket súlyosan érintő más közegészségügyi problémák kezeléséhez is.

Észak-koreai hackerek rengeteg kriptovalutát loptak

Az Egyesült Államok Igazságügyi Minisztériuma bejelentette, hogy államilag támogatott három észak-koreai hacker több mint 1,3 milliárd dollár értékű kriptovalutát próbált egymással összehangolva ellopni.

Mindhárman az ország Általános Felderítési Iroda néven ismert katonai hírszerző csoportjának tagjai. Komoly kriptográfiai „bevetésen” vettek részt, hogy így próbáljanak pénzt szerezni a nemzetközi szankciók által sújtott Észak-Koreának. Tevékenységük szélesebb körű művelet része.

eszakkorea.jpg

„A kriptovaluták teljesen megváltoztatják a szankciók kiszabásának módját, hatékonyságukat” – állítja Stephanie T. Kleine-Ahlbrandt, a Henry L. Srimson Központ agytröszt kutatója.

Amerikai kormányzati szervek szerint a trió sikeresen ellopott 112 millió dollárt, amelyből 11,8 millióval egy meg nem nevezett New Yorki pénzügyi vállalatot károsítottak meg. Az Igazságügyi Minisztérium közleménye alapján a szórakoztatóipart, például a 2014-es Az interjú című film bevételeit is célba vették. Mindezek mellett pénzkiadó automatákat fosztogattak a biztos távolból, adathalász tevékenységet folytattak, kriptovalutás átveréseket végeztek.

eszakkorea0.jpg

Az észak-koreai hírszerzők fegyver helyett inkább egérrel és billentyűzettel dolgoznak, pénzeszsákok helyett kriptovalutával teli digitális pénztárcákat lopnak. A hackelések zöme anyagtalan digitális pénzeszközökkel történik, ami egyértelműen jelzi a bűn természetének megváltozását. Mivel tevékenységük a cyberbűnözés és a cyberhadviselés határterületére tehető, nehéz alkalmazkodni hozzá.

„Az eset különösen figyelemreméltó, mert tökéletesen szemlélteti egyes nemzeti kormányok és a kifinomult módszerekkel dolgozó cyberbűnözők közötti egyre markánsabb szövetséget. A három személy méretükben előzmények nélküli online bűnöket követett el: zsarolóvírusos támadásoktól adathalász kampányokig, digitális bank-trükköktől kvázi lekövethetetlen pénzmosásig, szinte mindent csináltak” – nyilatkozta Michael R. D’Ambrosio amerikai biztonsági szakember.

Nem először gyűlt meg a bajuk észak-koreai elithackerekkel. Az ATP 38 néven ismert csoport 2018-ban például közel egymilliárd dollárt rabolt el online bankoktól és kriptovaluta-kereskedőktől. Ők többek között hamis kriptovalutával támadtak be digitális váltókat. A befolyt összegeket amerikai források szerint az ország katonai arzenáljának növelésére, például nukleáris fegyverek fejlesztésére fordítják.

Saját építésű robot etet egy férfit

A neurodegeneratív betegségek elsősorban az emberi agy idegsejtjeit érintik, fokozatos leépülésükhöz vagy elhalásukhoz vezetnek. Az idegsejtek általában nem szaporodnak, nem képződnek újra, így sérüléskor, elhaláskor a test nem pótolja őket. Az amiotrófiás laterálszklerózis (ALS) esetében a központi idegrendszer mozgató idegsejtjeinek a pusztulása miatt az akaratlagos izmok elgyengülnek, végül teljesen elsorvadnak. Az ALS gyógyíthatatlan, oka ismeretlen.

Miután Matt McKeown, 39 éves michigani mérnököt ALS-szel diagnosztizálták, gyorsan vásárolt és épített egy csomó szerszámot, hasznos szerkezetet, hogy gyengülő izmait amennyire lehet, pótolja velük.

robothelp.jpg

Amikor az ujjbegyei lebénultak, például fogóval kezdett szorítani dolgokat. Végül személyi asszisztens robotot épített magának, hogy a gép etesse, amikor már nem tud megfogni fémtárgyakat. A robot összeszedi neki az ételt, megitatja, ha kell.

A fejlesztés célja az volt, hogy McKeown a lehető leghosszabb ideig megőrizze önállóságát, és amennyire csak módjában áll, független és önfenntartó maradhasson, de a robot kereskedelmi forgalomban beszerezhető változatáért se kelljen dollárezreket kiadnia.

robothelp0.jpg

A gépet egy barátjával közösen építette, nagyjából 300 dollárból jött ki az egész. Egy hasonló robotért akár hússzor ennyit ki kellett volna fizetnie. Ezek a segítő szerkezetek sajnos nagyon sok ALS-ben szenvedő beteg számára abszolút megfizethetetlenek.

„Rossznak tartom, hogy egy ennyire hasznos szerkezet ilyen sokba kerül. Ezért döntöttem úgy, hogy egy nagyon tehetséges barátom segítségével, magam fogom megépíteni” – nyilatkozta McKeown.

Robotépítés mellett klinikai kutatásban is részt vett, valamint lajstromba vette a függetlensége fenntartásában segítő, változatos eszközöket. Bízik benne, hogy listája amiotrófiás laterálszklerózisban szenvedő más betegek számára is hasznos lesz.

„Jelenleg nincs remény a felépülésre vagy jobb gyógyszerre, viszont mindenki próbálja a jövőt jobbá tenni a jelennél” – magyarázza McKeown.

Mit érez egy mesterséges intelligencia, ha műalkotásokat lát?

Amikor egy képre nézünk, a kereten túlmutató jelentéseket érzékelünk. Emberi lényegünkből fakad, hogy így viszonyulunk az alkotásokhoz.

Ha valami hasonló képességet elsajátítanak, akkor a jövőben fontos szerephez juthatnak a Homo sapienst a világ értelmezésében segítő gépi rendszerek. Legyen szó művészi munkák kiértékeléséről, termékajánlásról, egészségügyi képek értelmezéséről vagy éppen gyártott tömegtermékek hibáinak kiszűréséről, ezirányú tevékenységük rendkívül szerteágazó lehet.

mi_art.jpg

Kutatók évek óta kísérleteznek mesterségesintelligencia-algoritmusokkal, programokkal, hogy ismerjék fel képek, különösen emberi arcok és érzelmek kapcsolatát, társítsák össze őket. Néhány rendszert betanítottak alapérzelmeket kifejező szintetikus arcok generálására, míg egyes szoftverfejlesztők úgy próbálják eladni terméküket, hogy az, arckifejezések felismerésével például munkaerő-toborzásban segít vállalatoknak.

mi_art0.jpg

A Stanford Egyetem és más felsőoktatási intézmények közös kutatásának eredményeként, most egy művészetkritikus mesterséges intelligencia igyekszik megítélni alkotások emocionális hatásait. A mélytanuló rendszert hosszasan trenírozták, hogy szubjektív értelmezéseket generáljon.

mi_art1.jpg

A fejlesztők képeket szubjektív kommentárokkal kiegészítő ArtEmis adatsorán gyakorolt az MI. Tetemes mennyiséget, fényképeket, festményeket, a WikiArt online enciklopédiából gyűjtött képeket, összesen 81500 alkotást ismerhetett meg.

A képeket emocionális jellemzőikkel (vidámság, félelem, szomorúság stb.) címkézték fel, és mindegyikhez az adott érzelem és a kép kapcsolatát magyarázó leírást készítettek. Az MI megtanulta utánozni az annotációkat, majd tovább finomítottak rajta. Tesztképekhez kellett az érzelmileg legközelebb állókat megtalálnia, aztán a képekhez társított megjegyzések következtek, neki is kellett szövegeket generálnia.

Önkénteseknek ki kellett találniuk, hogy a megjegyzések embertől vagy az MI-től származnak. A modell által létrehozottak feléről mondták, hogy ember írta. A kutatók viszont megállapították, hogy a gép annotációi nagy átlagban kevésbé pontosak, fantáziadúsak és változatosak.

A számítási kapacitás nemzeti erőforrás

A 37 tagországból álló, párizsi székhelyű Gazdasági Együttműködési és Fejlesztési Szervezet, az OECD 60 ország 300-nál több mesterségesintelligencia-szabályozási, stratégiai kezdeményezését katalogizálta. Mivel a rendelkezésre álló számítási kapacitások nagyon eltérnek, a döntéshozóknak látniuk kellene, hol van szükség a célok kivitelezéséhez fontos befektetésekre.

A kormányok folyamatosan foglalkoznak a szabvány mutatókat, például a GDP-t javító ötletekkel. A számítási kapacitásokat értékesítő vállalatok tevékenységükkel javítanak ezeken a mutatókon, és a kormányokat a mesterségesintelligencia-kutatásokat is segítő nagyobb infokom beruházásokra ösztönzik.
De mennyi számítógépes kapacitás áll egy-egy ország rendelkezésére MI-stratégiája sikeres megvalósításához? A kérdést az OECD megbízásából egy nemzetközi csoport igyekszik megválaszolni.

resources.jpg

A lehetőségek felmérése után, az állapotok pontos leírásával igyekeznek segíteni a racionális befektetésekben, és a leírásokból egy-egy ország azt is tudja, hogyan áll a többihez képest.

Az Nvidia elnöke, Keith Strier által vezetett munkacsoportban harmincan, döntéshozók, kutatók, hardver-szakértők és adatközpontok működtetői dolgoznak. A projekt az OECD MI-rendszereket csoportosító, megbízható MI-k fejlesztésében segítő, az MI-politikához iránymutatást kialakító One AI kezdeményezésének része.

resources0.jpg

Keretet dolgoznak ki a nemzeti és regionális feldolgozó-kapacitások összehasonlításához, méréséhez (benchmarking). Mihelyst elkészültek vele, minden egyes országot górcső alá vesznek. Kormányzati ügynökségekre, nemzeti mesterségesintelligencia-felhőinfrastruktúrákra fognak összpontosítani. A katonai kapacitásokkal, a kereskedelmi szolgáltatásokkal és a vállalati, szolgáltatói maghálózatokhoz belépési pontot biztosító éleszközökkel (edge devices), például routerekkel, routing kapcsolókkal stb. nem foglalkoznak a projektben.

Egyelőre nem tudni, hogy az állami és a magánszféra közötti együttműködések, például a Google és a szaúdi állami olajvállalat Aramco nagyobb cégeknek felhőinfrastruktúrát biztosító partnersége a vizsgálódás tárgyát képezik, vagy sem.

Az OECD által eddig kidolgozott mesterségesintelligencia-alapelveket 2020 júniusában (a tagoknál többen) 40 ország írta alá.

Bill Gates szerint terroristák fejleszthetik ki a következő gyilkos vírust

A világ két nagy veszéllyel néz szembe: a klímaváltozással és a bioterrorizmussal – nyilatkozta a Veritasium YouTube-csatornán Bill Gates.

Katasztrofális következményei lesznek, ha alig fektetünk be járványokat megállító rendszerekbe, és „ha a következő évtizedekben bármi 10 milliónál több embert megöl, a legvalószínűbb, hogy inkább egy nagyon erősen fertőző vírus lesz, mintsem háború” – prognosztizálta a Microsoft-társalapító egy 2015-ös TED Talkon, és igaza lett. Mellékszálként: Bill Gates a koronavírussal kapcsolatos őrült összeesküvéselméletek főszereplője, az agymenések kitalálói előszeretettel emlegetik ezt az előrejelzését, bár a Covid-19 áldozatainak száma szerencsére távol van a 10 milliótól. Eddig 2 milliónál többen hunytak el a járvány miatt.

billgates0.jpg

Most viszont Gates már arról beszélt, hogy – összeesküvéselmélet-hívők figyelem! – a következő még rosszabb lehet, mert szándékosan vethetik el a katasztrófai magjait.

„A bioterrorizmus, amikor valaki szándékosan azért hoz létre egy vírust, hogy ártson vele, szintén kapcsolatba hozható a járványokkal, és senki nem szeret róla beszélni. Nagyobb az esélye, mint a természetes eredetű pandémiáknak, mint a mostani” – jelentette ki a filantróp tevékenységéről is híres Gates.

billgates.jpg

A bioterrorizmus veszélye sem jelenti azonban azt, hogy ne készüljünk fel a következő világjárványra. Ha komoly összegeket fektetünk a kutatásokba, és növeljük a tesztelési kapacitásokat, az elhunytak száma drasztikusan csökkenthető.

„Nem tudhatjuk, mikor csap le a következő, és hogy influenza, koronavírus vagy eddig soha nem látott, új járvány lesz. Azt viszont tudjuk, hogy még egyszer nem várakozhatunk ölbe tett kézzel. A fenyegetés mindig velünk lesz, ha csak nem tesszük meg a megelőző lépéseket” – írta a Bill és Melinda Gates Alapítvány januári, éves levelében.

Tabujellege miatt, és mert a nagy médiumok alig foglalkoznak vele, Gates számára szokatlan a bioterrorizmusról, mint speciális fenyegetésről beszélni, ráadásul az elmúlt tizenkét hónapban nagyon átpolitizálták a témát, például Donald Trump eleinte többször utalt arra, hogy a Covid-19-et laborban állíthatták elő.

A valóság eddig rácáfolt a vádaskodásra, a koronavírus természetes eredete viszont távolról sem jelenti azt, hogy a közeljövőben laboratóriumi úton ne fejlesszenek a mostaninál gyilkosabb vírusokat.

Érzelmeinket észleli a gépi értelem

Képzeljük el, hogy hazaértünk a munkából, pocsék a hangulatunk, okos hangfalunk automatikusan „leszkenneli” az érzelmi állapotunkat, és megnyugtató muzsikával kedveskedik nekünk.

Utána képzeljük el azt is, hogy a rendőrség kihallgatja a közeli országút alatt bombák elhelyezésével gyanúsított, de mindent tagadó személyt. Feltételezett cinkostársairól mutatnak fényképet, ám változatlan tagad. A helyiségben lévő antenna figyeli a szívverését, miközben ő a fotót nézi. Az adatokat mesterséges intelligencia elemzi, és megállapítja, hogy az illető érzelmei nagyon mást mutatnak, mint amit elmondott.

A Londoni Queen Mary Egyetem kutatói a szívritmus apró változásait észlelő rádióhullámokat használva, tanítják meg egy mély mesterséges ideghálónak a jelek értelmezését, hogy találja ki belőlük: milyen érzelmekre utalnak.

emocio_radiohullamok.jpg

Kicsi rádió adóvevővel dolgoztak, az azzal összegyűjtött adatokat különféle szívritmusokat tartalmazó adatbázisba tették. A szívritmusok érzelmi állapotoknak felelnek meg, alanyaikat erősen emocionális videók nézése közben figyelték meg. A nyugalomnak, a félelemnek, az undornak és az örömnek feleltek meg.

A kutatók alanyaikat elektrokardiogrammal is leellenőrizték, hogy biztosak legyenek az antenna által rögzített adatok pontosságában. Az adatokat mesterséges idegháló vizsgálta. 71 százalékos pontossággal dolgozott, azonosított érzelmi állapotokat.

Teljesítménye jobb, mint egy, korábban bő 60 százalékot teljesítő, szintén gépitanulás-alapú rendszeré. Az előbbinek ráadásul sokkal több munkát kellett elvégeznie, alaposan meghatározott jegyeket kivonatolt adatsorokból. Az ideghálók jobban dolgoznak, pontosabb eredményekre képesek az idő által erősen meghatározott adatsorokkal, például a rádióhullámokkal, mint a hagyományosabb mesterségesintelligencia-technikák.

A fejlesztéssel az egészségügyben és a wellness-iparban dolgozók jobban megérthetik betegeik, ügyfeleik érzelmi állapotát. Másrészt viszont kevésbé gyógyító, építő-szépítő területeken, például – és valószínűleg elsődlegesen – a nemzetbiztonságban is hasznosíthatják. Ez utóbbi alkalmazásokhoz sok előzetes kutatásra lesz még szükség.

A 71 százalék távolról sem ideális, és a gépi értelem egyelőre érzelmeinket nem teljes komplexitásukban észleli, az új fejlesztéssel viszont közelebb kerültünk az ilyen rendszerekhez.

Kamu DNS-t hoz létre a mesterséges intelligencia

Mesterségesintelligencia-algoritmusok manapság általában hihető, megtévesztő képeket készítenek nemlétező személyekről, vagy állítanak elő meggyőző műalkotás-utánzatokat, írnak cikkeket, de még pokémonokat is generálnak. Hatékonyan működik a kamukép (deepfake) ipar, és amíg virtuális asszisztenseink élethűségével voltunk elfoglalva, egy észt-francia kutatócsoport szintet lépett.

Algoritmusuk egész pontosan a molekuláris szintre ment le, és szintén nemlétező személyek genetikai kódjával állt elő. Az MI generatív ellenséges hálózatot (generative adversarial network, GAN) használ: egy GAN-ben két idegháló dolgozik együtt, de egymás ellen. Az egyik képet, videót, bármit generál, a másik valódi példákkal összehasonlítva, „megkritizálja” a munkáját, mire az korrigál rajta, utána megint jön a kritika, és a „játék” mindaddig folytatódik, amíg élethű kimenetet nem generálnak.

kamu_dns.jpg

Ez történt most is; a Tartui és a Párizs-Saclay egyetemek kutatói szerint a GAN a valóditól megkülönböztethetetlen emberi genomokat generált. Sok deepfake projekt szórakoztatásra vagy manipulációra használt eredményeivel ellentétben, elmondásuk alapján kamu génszekvenciáikat genetikusok valódi tudományos célokra használhatják fel.

DNS-kódjaikkal genetikai kísérleteken dolgozhatnak, és információbiztonsági, személyiségi jogi (privacy) szempontból sem mindegy, hogy létező vagy nemlétező személyek genomjával folynak a kutatások. A jelenlegi szabályozás nagyon szigorú, ezért például kutatók nehezen tudnak adatsorokat megosztani egymással. Szintetikus DNS esetében változna a helyzet.

kamu_dns0.jpg

Ugyanakkor, míg a képek, műalkotások stb. alapján a maga „kamuművét” létrehozó algoritmusok elsősorban az MI tanulási folyamatát javítják, és viszonylag bejáratott terepen ténykednek, addig a valódi emberi genommal kapcsolatban rengeteg a megválaszolatlan kérdés. Nem ismerjük pontosan a különféle részek egymáshoz való kapcsolatát, hogy ez vagy az pontosan mit is csinál.

Mindaddig, amíg ezekre a kérdésekre nem kapunk választ, kétséges, hogy kamu DNS mennyire használható gépi tanulásra, mennyire tekinthető pontos gyakorlóadatnak.

„Érdekes projektnek tartom, de nem vagyok meggyőződve arról, hogy jelenleg van gyakorlati haszna. Tudományos közösségek próbálják megfejteni a genom nem-kódoló régióinak működését. Csak azért, mert az algoritmussal készített genomokat számítástudományi szempontból nem tudjuk megkülönböztetni a valóditól, nem biztos, hogy az előbbiek megőrizték az eredeti teljességét, összes fontos funkcióját” – nyilatkozta Deanna Church, az Inscripta biotechnológiai cég igazgatóhelyettese a fejlesztésről.

Church szerint messze vagyunk attól, hogy mesterséges intelligenciák által készített szintetikus genomokat húsvér emberi sejtekké alakítsunk át.

Etikai kérdések szintén felmerülhetnek. Egyelőre ugyan sci-fi kategória, de könnyen elképzelhető, hogy például bűnözők visszaélnek kamu genomokkal.

Jobban megy a gépi tanulás, ha a szavakhoz képeket társítanak

Szavak jelentésének memorizálásában sokat segít gyerekeknek, ha az adott szót valamilyen képhez tudják társítani.

Az Észak-karolinai Egyetem kutatói gépitanulás-modellekkel próbálnak hasonlót elérni. A modellek a vizualizált tókeneknek vagy vókeneknek nevezett kép-szó párokból álló méretes adatsoron gyakorolnak.

voken.jpg

Képek hangsúlyozzák, nyomatékosítják szavak jelentését, az adatsorokban viszont jóval kevesebb az ilyen pár, és a nyelvi modellek betanításához használt korpuszokkal összehasonlítva, kicsi a szótáruk is. Ugyanakkor jól használhatók modellek tanításához, hogy megtalálják a szavak és a képek közötti kapcsolatokat. Az ezzel a párosítással működő, jól bejáratott nyelvi modellek is jobban megértenek szavakat.

A kutatók egyedi szavakkal és képekkel tanították a vizuális tókeneket generáló rendszert (vokenizer), amely a vókenek segítségével jelzett előre párokat. Utána változatos nyelvi feladatokhoz finomhangolták.

voken0.jpg

A rendszer előre trenírozott vizuális és a nyelvmodellből áll, mindkettőhöz kétszintes idegháló kapcsolódik. Ezek a bemeneti képekhez és tókenekhez generálnak megjelenítéseket. Tucatnyi objektumtípust feliratokkal ábrázoló adatbázissal dolgozva, jutottak el tóken-kép párokig – egy képet egy adott felirat összes tókenjével társítottak.

Utána többmillió objektumot tartalmazó adatsorral dolgoztak. A rendszer az objektumokat az angol nyelvű Wikipédiából származó szavakkal próbálta leírni. Egy másik nyelvi modellnél véletlenszerűen szedtek ki tókeneket a Wikipédian talált mondatokból. A modellt megtanították a hiányzó tókenek és a hozzájuk kapcsolódó képek előrejelzésére.

Ezt követően jött a rendszer nyelvmegértési, kérdezz-felelek és nyelvi következtetési feladatokra történő finomhangolása. A modell összességében jobban teljesített, mint a kevesebb képi elemmel dolgozó többi.

A kutatás tanulsága, hogy vizuális tanulás a legjobb nyelvi modelleken is javíthat. Márpedig, ha képekkel dolgozva, eredményesebb, akkor akár hangokkal is ki lehet próbálni. Ez lesz a következő lépés?

Az Amazon figyelő szemei a fuvarosokon

A mesterséges intelligencia sokféleképpen képes növelni a hatékonyságot és a biztonságot, de nagyon nem mindegy hogyan: a felhasználót gazdagítja valamivel, levesz róla terheket, vagy ellenkezőleg, elbizonytalanítja, bizalmatlanná teszi?

Az Amazon novemberben jelentős mértékben, 400 ezernél többre növelte áruszállító sofőrjeinek a számát. Eddig a SmartDrive gépilátás-rendszere figyelte folyamatosan a nagyobb távolságra tartó vezetőket, és „vigyázott”, hogy ne aludjanak el, ne terelődjön el a figyelmük. Nem egyedi eset, mások is élnek a mesterséges intelligencia lehetőségeivel, például a versenytárs United Parcel Service szintén okos technológiával, a Lytx DriveCam-mel monitorozza a sofőröket.

amazon_5.jpg

Az Amazon tovább finomítja a technikát, most már a jármű belsejében lévő kamerák figyelmeztetik az ellenőrzést végző személyeket, ha a sofőr veszélyesen viselkedik. Az online kereskedelem világvezető vállalata az ülések fölé szerelte a Netradyne Driveri rendszerét, amely jelez, ha a vezető olvas, nem kapcsolja be a biztonsági övet, a megengedettnél nagyobb sebességgel vezet, nem vesz tudomást jelzőtáblákról stb.

A gyorsulásmérővel és giroszkóppal kiegészített kamerák az utcát, a külső környezetet és a járműbelsőt egyaránt monitorozzák. A rendszer 16 nem biztonságos viselkedésformát tud azonosítani.

amazon0_5.jpg

Ha veszélyes magatartást érzékel, figyelmezteti a vezetőt, és azonnal videót küld róla az Amazonnak, A vezetők manuálisan tölthetnek fel potenciálisan problémás eseményeket, például a járműhöz túl gyorsan közeledő személyeket vagy megközelíthetetlen helyszíneket megjelenítő mozgóképanyagokat.

A Netradyne elmondta, hogy rendszerének használatával kétharmaddal csökken az összeütközések száma.

A Driveri megosztja az Amazon sofőrjeit. Többek szerint megsérti személyiségi jogaikat (privacy), feleslegesen nagy nyomást helyez rájuk, hogy megfeleljenek a cég agresszív szállításütemezésének.

Az Amazon rendszerét mások is bírálják. A New York Times és a BuzzFeed szerint a nyomásgyakorlás veszélyezteti a biztonságos vezetést, még több lehet a karambol és a halálos járműbaleset. Támogatói viszont a stresszes állapotban gyakori emberi hibák csökkenéséről beszélnek.

süti beállítások módosítása