Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Megmondja a komputer, hogy mitől emlékezetes egy kép

2019. november 21. - ferenck

Egyes képekre sokkal tovább emlékszünk, mint másokra. De vajon miért? Ha megkérdezünk egy művészt, általánosan elfogadott elvekkel fogja megmagyarázni. Manapság azonban nemcsak húsvér művészektől, hanem mesterséges intelligenciáktól is érdeklődhetünk a miértek után.

Az MIT (Massachusetts Institute of Technology) kutatói MI-modellt dolgoztak ki a képeket emlékezetessé tevő elemek vizualizálásához.

„Módszerünk képileg jeleníti meg az emlékezetességet. Vizuálisan definiál valamit, amit nehéz szavakkal megragadni” – magyarázza Philip Isola, az egyik kutató.

emlekezetes_kepek.jpg

Munkájuk a képek emlékezetességét osztályozó, a döntést befolyásoló vizuális jegyeket kiemelő MemNet modellre épül, amelynek előrejelzései 60 ezer képen végzett online tanulmány eredményeire támaszkodnak.

Az MIT tanulmányhoz kapcsolódik még a generatív ellenséges hálózati technikával működő, három modulból álló GANalyze modell. Az egyik modul alapja a MemNet, kiszámolja, milyen effektusokkal tehető emlékezetessé egy kép. Utasításait átalakító modul valósítja meg, a végső változatot pedig a generátor modul kivitelezi.

A fejlődés olyan, mint egy time-lapse kép. Például egy sajtburger fotója az emlékezetességi skála hátsó részéből egyre előkelőbb helyre került, és egyre ínycsiklandozóbb látvánnyá vált, miközben egy katicabogár fényesebb lett, míg egy másik ételen látható bors színe kaméleonként változott a zöld és a vörös között.

emlekezetes_kepek0.jpg

A kutatók az emlékezetességet leginkább befolyásoló tényezőket vizsgálták. Online felmérésből kiderült, hogy a világos színek, az egyszerű háttér, a négyszög- és a körformák, valamint a személyek/tárgyak központi elhelyezése a legfontosabb szempontok.

„Az emberi agy úgy fejlődött, hogy ezekre fókuszáljon, és a GAN is ezeket emeli ki” – nyilatkozta Lore Goetschalckx, a Leuveni Katolikus Egyetem kutatója.

Az MIT-s csoport újrakonfigurálta a GANalyze-t, és a rendszer változatos esztétikai minőségű, eltérő érzelmi hatást kiváltó képeket generált. Kiderült, hogy az esztétikai és emocionális szempontból többre értékelt képek világosabbak, színesebbek, mélységekkel az elmosódó háttérben. A legesztétikusabb képek viszont nem mindig bizonyultak emlékezetesnek.

A GANalyze különféle alkalmazásokban hasznosítható: kiterjesztett valóság (AR) rendszerben tárgyakat felnagyítva/feljavítva hozzájárulhat a memóriavesztés kezeléséhez, felejthetetlen grafikákat generálva segítheti az olvasót az információ megjegyzésében, amellyel forradalmasíthatja az oktatást. Szintetikus, de realisztikus képek létrehozásával automatizált rendszerek tárgyfelismeréséhez adhat fogódzókat.

Összességében jelentős mértékben javíthat az ember-gép interakció minőségén.

Robotkutyák a parkban

Gyakran tesszük fel magunknak a kérdést, hogy milyen lesz a jövő. Egy bostoni (egész pontosan Cambridge, Massachusetts) parkba látogatók egy borongós őszi délelőtt választ kaptak rá, legalábbis az MIT (Massachusetts Institute of Technology) diákjai felvillantottak valamit a holnapból, a járókelők legalábbis láthatták a holnap egyik olvasatát.

Sokkal békésebb, derűsebb és szórakoztatóbb jövőt, mint a hollywoodi filmekben vagy az új Terminátorban.

A felsőoktatási intézmény Biomimetika Laboratóriuma videóra vette amint a geekek kört formáltak, mindegyik távirányítóval irányított egy-egy bukfencező, szaltózó, ugráló, focizni próbáló mini robotot, összesen kilencet az őszi levelek között.

robotkutya0_1.jpg

A gépek az egyetem évek óta fejlesztett Mini Gepárd szerkezetei, könnyű és moduláris négylábúak. A Boston Dynamics keretében indult projekt idei legfőbb eredménye, hogy megtanultak bukfencezni, és a videóból kiderül: a laborban komolyan gondolhatják a gyártást, talán el is kezdődött, mindenesetre kilenc példány van már.

Tömegük 9 kiló, 12 elektromos motor hajtja őket, másodpercenkénti 2,5 méter, óránként 9 kilométer sebességgel futnak. Példányonként akkorák, mint egy közepes méretű kutya. Mindegyiket manuálisan, RC kontrollerszerű szerkezettel vezérlik.

robotkutya_1.jpg

Sangbae Kim, a labor igazgatója elmondta, hogy a botokat különféle kutatási célokra használják, rugalmasságot és egy kis keménységet megkívánó problémák megoldását tesztelik velük. A moduláris kivitelezés lehetővé teszi a meghibásodott részek cseréjét, masszív vázuk pedig biztosítja, hogy a gépek túléljék az összeütközéseket, hanyatt vágódásokat stb.

„A Mini Gepárd mérete kb. tökéletes. A 9 kiló tömeg nem túl kicsi, de nem is elég nagy ahhoz, hogy veszélyes vagy törékeny legyen. Úgy terveztük, hogy feldolgozza az ugrások, talpra érkezések stb. hatását” – nyilatkozta Kim.

A technológia több részterületének beérésével, egyre többen fejlesztenek négylábú robotokat. Legismertebb példányuk a Boston Dynamics, szeptemberben ipari és kutatómunkára kölcsönzött Spot nevű gépe.

Egyelőre főként munkák figyelésére használják, és ezekben a feladatkörökben, például olajfúró toronynál olcsóbb és biztonságosabb is ember helyett robotot alkalmazni. A közeljövőben viszont új munkaköröket találhatnak, például csomagokat szállíthatnak házhoz, járőrözhetnek stb.

Mini Gepárdék viszont még csak bukfencezni és ugrándozni tudnak.

Lézeres támadás intelligens asszisztensek ellen

Mióta bevezették a hangalapú digitális asszisztenseket, folyamatos biztonsági problémát jelentenek; Siri (Apple), Alexa (Amazon), a Google Home és társaik egyaránt viszonylag könnyű hacker-céltáblák. Népszerűségük ennek ellenére folyamatosan nő, az online vásárlástól az okos otthon bezárásáig, milliók használják őket változatos célokra.

Japán és amerikai kutatók olyan támadásmódra figyelmeztettek, amire nem valószínű, hogy bárki is gondolt. Az asszisztensek, azaz a készülék mikrofonja akár 110 méterről (ez a mostani maximális távolság) lézerirányzóval, villózó fényekkel célba vehető, megtrükközhető.

lezeres_tamadas.jpg

A kutatók egy irodaház negyedik emeletén használt Google Home-os eszközt 70 méter távolságról, egy harangtoronyból támadtak meg, de teleobjektívvel távolabbról is megy.

Egy alkalommal garázsajtót nyitottak ki. A lézersugarat az ajtóval összekapcsolt hangasszisztensre irányították, és nem csak a garázs, hanem a vele összekötött többi rendszer (villanykapcsolók, autók stb.) is manipulálhatók.

Kevin Fu, a Michigan Egyetem villamosmérnöke szerint új sebezhetőségi felületről van szó, és egyelőre felbecsülhetetlen, hány terméket érinthet.

lezeres_tamadas0.jpg

A támadás azért lehetséges, mert a mikrofonok úgy reagálnak a fényre, mintha hang lenne. Egy belsejükben lévő kicsi lap, a diafragma megmozdul, ha hang éri.

Ha a lézert vagy a villózó fényt megint az azt elektromos jelekké átalakító diafragmára irányítjuk, a mozgás megismételhető. A rendszer többi része úgy reagál rá, mintha hang lenne.

Megoldás lehet, ha az összes érintett mikrofont újratervezik. Sajnos nem működik, ha egyszerűen csak letakarják.

Biztonsági szakértők folyamatosan figyelmeztetnek az internetre kapcsolódó készülékek sebezhető pontjaira, újabb potenciális hacker módszerekre, például emberi füllel nem hallható rejtett utasítások elküldésére. Többségüket, mint a lézeres megoldást egyelőre ritkán aknázzák ki, de a dolgok internetével (IoT) és az egyre több géppel a támadási lehetőségek száma állandóan nő.

Az Amazon egyik szóvivője elmondta, hogy a kutatókon kívül senkitől nem hallottak még lézeralapú támadásokról. Fontos esetekre hang PIN-kódot vagy a legegyszerűbb megoldást, a mikrofon elnémítását javasolja. De az is működik, ha kintről senki nem látja a készüléket.

A hackereknek nem kell sokat költeniük: egy lézeres kütyü kb. 400, egy teleobjektív 600 dollár, azaz 1000 dollár befektetéssel nagyon fontos személyes adatokhoz férhetnek hozzá.

Földcsuszamlásokat észlel egy olcsó szenzor

India hegyes térségeiben, nagy esőket követően különösen gyakoriak a földcsuszamlások. A súlyos esőzések mellett az erdőirtás, a rossz minőségű utak és az engedély nélküli építkezések is növelik a kockázatot. A himalájai Himachal Pradesh az egyik legérintettebb szövetségi állam, évente kb. tucatnyi személy hal meg miattuk, és a halottak száma évről évre nő.

A helyi Indiai Technológiai Intézet (IIT) kutatói olcsó megoldást dolgoztak ki földcsuszamlások detektálására. Okostelefonokban található mozgásérzékelő, a sebességben bekövetkezett változásokat figyelő gyorsulásmérő az alap. Pár módosítással korai figyelmeztetéseket leadó rendszerré alakították át. 20 ezer rúpia (282 dollár) gyártási költsége töredéke a használatban lévő technológiákénak.

india.jpg

A mozgásérzékelőt a talaj mozgásának mérésére használják.

„A talajba ágyazott gyorsulásmérő akkor mozog, ha a talaj is mozog. Utóbbira általában akkor kerül sor, ha külső nyomás nehezedik rá. A szenzor adataiból meg tudjuk állapítani a mozgás nagyságát. A sok adatból látjuk a földcsuszamláshoz vezető elmozdulásokat” – jelentette ki a kutatást vezető Varun Dutt.

A változássorozatok segítenek a korai figyelmeztetésben. Ezek a jelek megkönnyítik a földcsuszamlás előrejelzését, ami lényegesen egyszerűbb, mint a sokkal spontánabb földrengésé.

india0.jpg

Miután az eszköz szignifikáns mennyiségű elmozdulást vett észre, hangos jelek és szöveges üzenetek formájában értesíti a legközelebbi érintett hatóságokat.

A kormánytól innovációs díjat is nyert fejlesztés eddig sikeresnek mondható. Himachal Pradesh államban tesztelik, egyszer például a később teljesen elpusztult útról küldetett vissza egy csomó autót, amivel életeket mentett meg. Máskor hegyomlást sikerült megakadályoznia.

„A technológiát bemutattuk, komoly igény mutatkozik iránta” – nyilatkozta Dutt.

A kutató viszont nem elégedett. Azt szeretné, ha a rendszer prediktívebb és reaktívabb lenne. E célból kezdtek el mesterséges intelligenciát és gépi tanulást használni hozzá.

Bizakodnak, hogy az MI hatására, új algoritmussal már 24 órával, de még inkább egy héttel földcsuszamlások előtt prognosztizálható lesz a baj.

Puha izmokkal működik a robotméh

A mikrorobotika egyik viszonylag új trendje, hogy mobil robotokhoz puha aktuátorokat használnak. Az aktuátorok kulcsszereplők a robotikában: a vezérlő algoritmus kimenő jeleit ők alakítják konkrét cselekvéssé.

A puha anyagok rugalmasságuk miatt népszerűek. Sok fejlesztő viszont még mindig szkeptikus, repülő szerkezetekhez nem tartják alkalmasnak őket. Az ok: az aktuátorok nem elég masszívak, nehéz az irányításuk.

Harvardi kutatók fejlesztése, egy robotméh (RoboBee) rácáfol a kételkedőkre. A puha mesterséges izmokat tartalmazó szerkezet falnak rohanhat, leeshet a talajra, összeütközhet más „méhecskével”, mégsem sérül meg.

robobee_1.jpg

Masszív is, és a vezérlésével sincsenek gondok. Mi több, az első puha aktuátorokkal működtetett, kontrollált repülésre képes mikrorobotként vonul be a technikatörténelembe.

Az aktuátorokat az áramot nem vezető, rendkívül jól szigetelő, elektromos térben deformálódó elasztomerből készítették. Az elektródák áramvezetését javítva, a kutatók 500 Hertzen működtették az aktuátorokat. Ugyanúgy funkcionáltak, mint a korábbi hasonló robotokba épített, kemény anyagokból álló elődeik.

Puha aktuátorokat tartalmazó rendszerekkel előfordul, hogy behorpadnak, elgörbülnek, és a rendszer elveszíti stabilitását. Ezt kiküszöbölendő, nagyon könnyű repülőgépvázat építettek, a robot görbülését, elhajlását megakadályozó, korlátozó szállal.

robobee0_1.jpg

Kisméretű robotokban az aktuátorok könnyen összeszerelhetők, cserélhetők. A többféle repülési lehetőség szemléltetésére többféle modellt építettek. A kétszárnyú változat fel tud emelkedni a talajról, de tovább nem irányítható. A négyszárnyú és két aktuátoros verzió zsúfolt környezetben is repül, egyetlen út alatt több ütközést kerül el. Összességében a kicsi és könnyű robotok egyik nagy előnye, hogy rugalmasak külső hatásokkal szemben.

A puha aktuátorok azért is hasznosak, mert a körülményekhez jobban alkalmazkodnak, mint a hagyományosak. Komoly szolgálatot tehetnek, ha a robotnak például keresési-mentési műveletben kőtörmelék között kell navigálnia.

A harmadik változat, egy nyolcszárnyú, négy aktuátoros modell lebegő repülésre is képes.

Következő lépés a hatékonyság növelése. Szükség lesz rá, mert a „puha gépek” ezen a téren jócskán le vannak még maradva.

„Ha sikerül kiváló teljesítményű mesterséges izmokat fejlesztenünk, csak a csillagos ég lehet a határ, a robotok kvázi mindenre képesek lesznek” – összegez Robert Wood, az egyik fejlesztő.

Elektronikus bőr a virtuális valóságban

A bőr az emberi test legnagyobb és legváltozatosabb funkciókra alkalmas szerve. Nemcsak különbséget tesz többféle stimuláció között, hanem a jelek intenzitását is széles spektrumon osztályozza.

A Drezdai Helmholtz Centrum (HZDR) és a Johannes Kepler Egyetem (Linz) kutatói elektronikus eszközbe integrálták ezeket a különleges tulajdonságokat. Az új érzékelő jelentősen leegyszerűsítheti az emberek és a gépek közötti interakciókat.

vr_szenzor.jpg

„A virtuális valóságban használt alkalmazások egyre komplexebbé válnak. Ezért különféle interakciós módokat feldolgozó és megkülönböztető eszközökre van szükségünk” – magyarázza Denys Makarov (HZDR).

A mai rendszerek azonban vagy a fizikai érintést rögzítik, vagy érintés nélkül követnek objektumokat. A két módszert először az új fejlesztésben integráltak egybe. A szenzor, egy mágneses mikro-elektromechanikus rendszer (m-MEMS) az érintés nélküli és a tapintásalapú interakciók elektromos jeleit egyaránt feldolgozza, valósidőben megkülönbözteti a stimulációk forrását, miközben más források zavaró hatását megszünteti.

vrszenzor0.jpg

A szimultán feldolgozás úgy valósul meg, hogy a szenzor nem ugyanazokon a területeken dolgozik a két jeltípussal. Az eddigi kísérletek azért hiúsultak meg, mert a különböző jelek túlzottan zavarták egymást.

A különlegesen rugalmas érzékelő tökéletesen illik a környezethez, még rosszabb feltételek mellett is működik. Bárhova, így az ujjhegyre is könnyen ráhelyezhető, ott érintkezik az emberi bőrrel.

A teszteken a kutatók mágnest tettek egy százszorszép levelére, mágneses mezője az ujjra rögzítettével ellentétes irányban hatott. Változatos fizikai jelenségek összjátékaként az ujj végül megérintette a levelet, tapintás nélküli módból másodpercek alatt váltott tapintásos interakcióra.

Ez az adottság garantálja, hogy a szenzor szelektíven képes vezérelni fizikai és virtuális tárgyakat. A platform automatikusan kapcsol át egyik módról a másikra. Egyes tevékenységekhez eddig több interakció kellett, az újítással egy is elég.

A szenzor megalapozhatja a közeljövő ember-gép interfészeit. Az elektromos bőr a virtuális és a kiterjesztett valóság (VR, AR) mellett főként steril környezetekben, például sebészi műtőkben használható.

Előrelátó vezetésre tanítják az okos autókat

Jó vezetők általában megelőzik a veszélyes helyzeteket.

Képzeljük el: üres éjszakai utcán rengeteg autó parkol, és semmi nem indokolja a különösebb elővigyázatosságot. Csakhogy a mellékutcából bármikor befordulhat egy jármű. Egy vezető folyamatosan kerül hasonló szituációkba, tapasztalatai alapján rutinszerűen cselekszik, hoz jó döntést.

Ezzel szemben az önvezető autók időnként úgy viselkednek, mint első órájukon a tanulóvezetők. A Bonni Egyetem kutatói a rutinszerű jó döntéseket eredményező a képességeket akarják megtanítani nekik.

teachingcars0.jpg

„Megelőző vezetői stílusra oktatjuk őket. Lehetővé válik, hogy sokkal gyorsabban reagáljanak veszélyes helyzetekre” – magyarázza a felsőoktatási intézmény gépi látással foglalkozó munkacsoportját vezető Jürgen Gall.

Az elképzelések megvalósításához, munkatársaival és az autonóm intelligens rendszereket kutató munkacsoporttal LiDAR adatokat kiegészítő és értelmező algoritmust fejlesztettek.

A LiDAR lézeralapú távérzékelés, a rendszert a legtöbb önvezető autó tetejére szerelik. A kibocsátó eszköz és valamely visszaverő felület távolságát határozza meg, a jármű környezetében kb. 120 ezer pontig. Minél nagyobb a távolság, annál képlékenyebbek a pontok, egy LiDAR szken alapján szinte lehetetlen pontos mérést végezni.

teachingcars.jpg

A kutatók többtucat szkent használtak, egymásra vetítették őket, így komplexebb lett a kép, és a szenzorok adataiból nemcsak a jelenre, hanem a jövőre is lehet következtetni – a környezet geometriájára, az ott lévő tárgyak térbeli kiterjedésére stb. Csupa olyan információra, amely egyetlen szkenből nem nyerhető ki.

Minden egyes pontot felcímkéztek, például „itt egy járda, ott egy gyalogos, mögötte egy motoros.”

Következő lépésben adatpárt tápláltak a programba: egyrészt egyetlen LiDAR szkent inputként, másrészt a hozzá kapcsolódó rávetített adatokat, köztük szemantikus információkat is, mint óhajtott output. A folyamatot megismételték, végül többezer párt kaptak.

Az algoritmus megtanulta kiegészíteni és értelmezni a szkeneket, azaz hiányzó méréseket rendelt hozzájuk, interpretálta a látottakat. A jelenet-kiegészítés viszonylag jól működik, a hiányzó adatok kb. felét találja el. A szemantikus értelmezés, például takart tárgyak kikövetkeztetése már kisebb sikerrel jár, a program itt csak 18 százalékot ért el.

A kutatók elmondták: a kezdetek kezdetén járnak. Eddig nem is voltak gépi tanulásra alkalmas méretű adatsorok, most már vannak. Gall optimista, szerinte lépésről lépésre közelítenek a megoldáshoz. Néhány éven belül az algoritmus a szemantikus értelmezésben is 50 százalékos teljesítményre lesz képes.

Ha így lesz, jelentősen javul az autonóm vezetés minősége.

Madarakat les a gépszem

Időnként több évig kell madarakat figyelnünk ahhoz, hogy az egyik fajt megkülönböztessük a másiktól. A Duke Egyetem kutatói lerövidítették a folyamatot, mélytanulás-alapú mesterséges intelligenciájuk sokkal rövidebb idő alatt akár 200 fajt azonosít. Úgy megtanították, hogy egy fajhoz egy kép elég neki.

Különlegessége, hogy nemcsak a végeredményt látjuk, hanem azt is, hogyan „gondolkozik”. Így jobban megértjük, és még az állatokat nem ismerők is képesek lesznek megkülönböztetni például a pingvint a Déli óceán más madaraitól.

aibirdwatch.jpg

A mély idegháló komoly tanulási folyamat eredményeként jutott el eddig. 200 madárfajt ábrázoló 11788 fényképpel gyakoroltatták, és ma már a legkülönfélébb környezetekben tevékenykedőket, például a vízben úszó kacsát és a légben szárnyaló kolibrit is felismeri.

Soha nem mondják neki, hogy „ez egy csőr” vagy „ez egy szárny, tollakkal”, helyette fotókat mutatnak. Az idegháló észreveszi rajtuk a fontos mintázatokat, majd a mintákat a korábban látott fajok tipikus jegyeivel összehasonlítva, találgatni kezd.

Menet közben hőtérképeket készít, amelyekből ilyen következtetéseket von le: „ez egy énekesmadár, kapucnis poszáta. A következő jegyek alapján ismerhető fel: álarcos fej, sárga has stb.”

aibirdwatch0.jpg

Az MI jelenleg 84 százalékos pontossággal dolgozik, nagyjából ugyanúgy, mint a legjobban teljesítő emberek. Magukból a statisztikákból persze nem derül ki, hogyan különbözteti meg az egyik verebet a másiktól.

A kutatás egyik vezetője, a felsőoktatási intézmény Előrejelzés-elemző laboratóriumát vezető Cynthia Rudin szerint a projekt túlmutat a madarak megnevezésén; sokkal inkább arról szól, hogy a háló mit lát, hogyan vizualizálja azt.

Hasonló technológiát használnak személyek felcímkézésére közösségi hálózatokon, gyanúsítottak kamerák általi megfigyelésénél, önvezető autók betanításához, hogy érzékeljék a lámpákat és a gyalogosokat.

A legnagyobb probléma, hogy mivel a mélytanuló algoritmusok a hagyományos szoftverekkel ellentétben explicit programozás nélkül tanulnak az adatokból, nem mindig egyértelmű, hogyan jutnak el a végeredményhez, hogyan csoportosítanak képeket.

Rudin és munkatárai igyekeznek bizonyítani: az MI-nek nem feltétlenül így kell működnie. Modelljeiket úgy tervezték, hogy magyarázzák el az állításaikat megalapozó érveket, döntéseik legyenek érthetők. Ha egy ilyen modell hibázik, tudjuk, miért téved.

Az algoritmust hamarosan más területen, orvosi képalkotásnál, mellrákra utaló jelek kiszűréséhez használják. Orvosokat fog utánozni.

Profi táncost csinál belőlünk egy MI

A Nvidia kutatói különleges mesterséges intelligenciát fejlesztettek, amely videók és mindössze egy kép alapján úgy alakítja át a képen látható személyt, mintha az illető a videón látottaknak megfelelően mozogna, táncolna. Például bárkiből profi táncost generál, és így tovább.

A videoszintézis (video to video synthesis) néven ismert technológia lényege, hogy az input mozgóképanyagot képre „másolva”, az utóbbit fotorealisztikus videóvá alakítja át.

nvidia.jpg

Természetesen nem most fordul elő először, hogy egy MI által generált videón valaki olyan mozdulatokat tesz, amelyeket a valóságban nem – az elmúlt évek fake news világa szolgáltatott rá épp elég példát –, a Nvidia fejlesztése azonban két szempontból mégis jelentősen különbözik a hasonló megoldásoktól, fontos előrelépés hozzájuk képest.

Egyrészt, ennek az MI-nek a gyakorláshoz nem kell sok kép a célszemélyről, céltárgyról, mert egy is bőven elég. Másrészt, a többi program lehetőségei korlátozottak, és csak a gyakorló adatsorban megtalálható személyekről, tárgyakról képes valamilyen anyagot generálni.

nvidia0.jpg

Az Nvidia algoritmusának erre nincs szüksége.

A kutatók megtanították a modellnek, hogy korábban nem látott emberekről, objektumokról a gyakorlóadatok használatát követően, egyetlen kép alapján alkosson videókat. Utána több forgatókönyvön (táncmozdulatok, beszélő fejek stb.) tesztelték, és működött.

A technika arcokra is alkalmazható, például olyan szöveget ad a szánkba, amit nem is mondtunk. Az MI szobrokat táncoltathat meg, élő avatárok készíthetők, járművek utcajelenetekbe másolhatók vele stb.

A végeredmény ugyan nem tökéletes, de minden eddiginél jobban szemlélteti, mennyire javul az MI-k által létrehozott kamuvideók, kamuképek (deepfakes) minősége. Ha a Nvidia közkinccsé teszi, a technikát a szórakoztatóiparban, filmekhez és játékokhoz alkalmazhatják.

A fejlesztéssel újabb lépéssel kerültünk közelebb a majdnem mindenkit megtévesztő, hibátlan online audiovizuális kamutartalmakhoz, amelyek immár szinte a minimumból létrehozhatók. Ez a tény egyben azt is jelzi, hogy mennyire fontosak a hamisítást kimutató technológiák.

A világ legkisebb titkosító kvantumchipje

A kvantumtechnológia a kommunikáció titkosítását és a titkosítás feloldását biztosító kvantumkulcs-kiosztással (quantum key distribution, QKD) is forradalmasítja a számítástudományt. Jó hír, hogy a szükséges miniatürizáció feltételei már adottak hozzá.

A szingapúri Nanyang Műszaki Egyetem (NTU) kutatói 3 milliméteres QKD chipet fejlesztettek. A fejlesztés azért fontos, mert hasonló kvantumszámítási rendszerek jégszekrény- vagy szobaméretűek is lehetnek, és egy ilyen kicsi, az eddigieknél legalább ezerszer kisebb chippel sok lehetőség nyílik meg, például okosórába, fitneszmérőbe stb. integrálható.

kvantum_3.jpg

A jelenlegi titkosító technikák jelszavakkal vagy biometrikus adatokkal működnek. Mindkettő kiszivároghat, meghackelhető. Ezzel szemben a kvantumtechnológiában a kulcs az üzenetbe kódolható, és csak az ugyanazzal a kulccsal rendelkező személy használhatja; olyan, mintha titkosított levelet írnánk.

A kvantumtechnológia lehetővé teszi a biztonságos kulcskiosztást, ellehetetleníti a kulcshamisítást. Ha elterjed, a jövőben sokkal nyugodtabban használhatjuk a pénzautomatákat, vásárolhatunk online stb. Az egyik fejlesztő, Kwek Leong Chuan szerint kockázatos bármit is meghackelhetetlen technikának nevezni, de ebben az esetben tényleg közel vagyunk hozzá. A kulccsal nem rendelkező személyek számára az üzenet ugyanis olvashatatlan.

kvantum0_3.jpg

Mivel a számítógépes rendszerek rengeteg digitális adatot tárolnak, és rengeteg digitális adattal kommunikálunk, a cyberbiztonság rendkívül fontossá vált. Amíg a kvantumszámítások nem terjednek el, teljes biztonságról csak álmodhatunk.

QKD rendszerek ugyan évek óta léteznek, méretük viszont jelentősen korlátozta a potenciális alkalmazások számát.

Az új chippel változik a helyzet. A számítógépgyártásban általánosan használt szilíciumból készül, így viszonylag könnyű és olcsó előállítani.

A szingapúri fejlesztés azonban még távolról sem termék, tömeges gyártásra egyelőre nem alkalmas, viszont jól szemlélteti a lehetőségeket. Eleinte klasszikus számításokon alapuló rendszerekkel együtt használhatják.

A chippel megint közelebb kerültünk a valódi kvantumszámítógépekhez.

„Ez a biztonságos kommunikáció jövője, segíteni fog következőgenerációs digitális kommunikációs eszközök, például bankok jobb szolgáltatásokat nyújtó pénzügyi portáljai vagy kormányzati rendszerek fejlesztésében” – nyilatkozta Liu Ai Qun fizikus (NTU).

süti beállítások módosítása
Mobil