Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Életszerűbbek lesznek a vezetés-szimulációk

2022. szeptember 08. - ferenck

A jelenlegi vezetés-szimulációk nem elég realisták, nem élethűek, és ez különösen a háttérben lévő objektumokra, például fákra, útjelzésekre érvényes. Az Ohio Állami Egyetem kutatói e problémára reagálva, új módszert dolgoztak ki szimulátorok által használt fotorealisztikus képek alkotására.

Az önvezető autók tesztelése sokat javulhat az új szimulációval.

A hagyományos számítógépes grafika részletes modelleket, rácshálókat és textúrákat használ 2D-s képek 3D-ssé alakításához. A folyamat egyrészt nagyon munkaigényes, másrészt a képek nem mindig meggyőzőek.

driving_simulation.jpg

Generatív ellenséges hálózatokkal (GAN) az ohiói kutatók úgy gyakoroltatták a programjukat, hogy véletlenszerűen generáljon élethű, hihető környezeteket. Ez különösen akkor fontos, ha önvezető járműben ülő személyek reakcióit, éberségi állapotát stb. tesztelik.

Az eddigi vezetés-szimulációk inkább számítógépes játékokra emlékeztetnek, így szinte senki nem veszi komolyan őket. Az új élethűbb tárgyaival viszont változást hozhat.

A nyílt forrású CARLA szimulátorból indultak ki, GAN-alapú képszintetizátorral dolgozták ki a hátteret: épületeket, növényzetet, égboltot stb. Ezeket a tárgyi elemeket hagyományosan renderelt objektumokkal kombinálták össze.

A hagyományos eljárás az elsődlegesen fontos elemek, például közeli járművek esetében kihagyhatatlan, a mesterséges intelligencia (GAN) viszont háttereknél és előtereknél jobban működik. Való világbeli adatokat használva dolgoz ki realisztikus megoldásokat.

Ehhez persze környezeti mintázatokat kell felismernie, amelyet tanulás útján el is sajátított, máskülönben nem tudna mit kezdeni autókkal, fákkal, árnyékokkal. A mintázatokat és a textúrákat azonban nem mérnökök tervezték, hanem sablonok alapján maga az MI.

Kiderült, hogy a jelenetek fotorealizmusa sokat javult, viszont nem egyszerre, hanem képkockánként módosították a szimulációt. Csakhogy mi nem képkockáról képkockára élünk, és az egész csak akkor lesz konzisztens, ha a felhasználó folyamatosnak, gördülékenynek érzi.

A kutatók pont ezen dolgoznak most.

Vízalatti kommunikáció okostelefonok között

Évente sokmillióan sznorkeleznek és búvárkódnak. Víz alatt tartózkodó más személyekkel egyelőre a kézjelekkel történő kommunikáció az egyetlen biztonságos és közvetlen érintkezési lehetőségük. A rekreációs céllal ott lévők kb. 20, a profik, például hivatásos búvárok mintegy 200 jelet használnak. Ezekkel értesítenek másokat az oxigénszintről, vízi állatok közelségéről, illetve segítik egymást feladatok elvégzésében.

Mivel a jelek vizuálisak, hatékonyságuk a távolságtól és a látási viszonyoktól függ. A kétirányú szöveges kommunikáció is alternatíva, eddig azonban csak egyedire kialakított, drága és nehezen beszerezhető hardverrel működött.

viz_alatt.jpg

A Washington Egyetem kutatói bemutatták, hogy a ma már többmilliárd okostelefonnal, okosórával is megvalósítható a kommunikáció. AquaAppjuk az első mobil alkalmazás a vízalatti érintkezésre, hálózatépítésre.

Az okostelefonok wifi és bluetooth kommunikáción alapulnak, amelyek nem hatékonyak víz alatt. Az AquaApp az okostelefonok és okosórák hangszóróját és mikrofonját használja. Csak az alkalmazást kell letölteni, és vízhatlan telefontok kell hozzá. A tokoknál nem mindegy a mélység, célszerűbb minél mélyebben is használhatót beszerezni.

Az interfész segítségével a felhasználó a kézjelzéseknek megfelelő 240 előre kiválogatott üzenet közül választhat, de a 20 egyszerűt külön kiemelték, hogy könnyen hozzájuk férhessünk. Az üzeneteket nyolc kategória (irány, környezeti tényezők, felszerelés állapota stb.) alapján szűrhetjük.

viz_alatt0.jpg

A fejlesztőknek szárazföldön és a légtérben nem ismert technikai kihívásokat kellett megoldaniuk: a jelerősség ingadozását a part, a tengerfenék, a vízfelület, közeli személyek és tárgyak okozzák; a mikrofonok és hangszórók okostelefon-típusokként változnak stb. Az appnak valósidőben kell alkalmazkodnia ezekhez. Ráadásul a készülékek elhelyezkedése, másokhoz való közelsége szintén gyorsan változik, plusz az alkalmazás sokféle (hajók, csónakok, repülők stb. által okozott) zajprofillal szembesülhet.

Az appot minden egyes üzenetküldésre valósidőben optimalizáló algoritmusokat fejlesztettek. Ha el akarunk küldeni egy üzenetet, először előzetest juttat el a fogadónak, akinek a készülékén az alkalmazás lefuttat egy algoritmust, amely meghatározza, hogy az illető a legjobb körülmények között kapja meg. Utána elküldhetjük az igazi üzenetet.

Hálózati protokollt is dolgoztak ki, amellyel megoszthatjuk a hozzáférést. Akár 60 egyedi felhasználó is rákapcsolódhat.

Az alkalmazást féltucat, különböző feltételeket biztosító helyszínen tesztelték, és kiderült: 113 méter távolságig, 12 méter mélységig működik, de üzenetküldésre a maximum 30, segélykérő jeladásra 100 méter az ideális. Ennyi szinte az összes lehetséges forgatókönyvre elég.

Figyelték az energiahasználatot is, ami négy óra alatt 32 százalék volt egy Samsung Galaxy S9 készüléken. Rekreációs célú búvárkodásra ez a maximális ajánlott időtartam.

Vízalatti kommunikáció a tömegeknek – vélik a fejlesztők.

A vízalatti hálózatiság viszont egyelőre ott tart, mint az internet az 1970-es években, az ARPANET korában. Az AquaAppban benne van a lehetőség, hogy gyorsan megváltoztassa a mostani állapotokat.

Egyre masszívabbak Kína mesterségesintelligencia-befektetései

2017-ben a kínai vezetés bejelentette, hogy 2030-ra az ország a világ elsőszámú mesterséges intelligencia innovációs központjává kíván válni. Az azóta eltelt időszakban az MI kutatások és fejlesztések felpörögtek, megsokasodtak az ezeken a területeken létrehozott termékek.

A legfrissebb MI Index szerint a távol-keleti ország adja a földkerekség MI magánbefektetéseinek egyötödét.

Ennek ellenére nem minden rózsás a kínai technológiai szektorban. A kockázati tőkebefektetés 2022 első négy hónapjában 43,5 százalékkal alacsonyabb volt, mint 2021 azonos periódusában. A csökkenés négyszer nagyobb, mint a világátlag.

chinaai.jpg

Az ezévi negatív számok ellenére, a McKinsey tanácsadó cég előrejelzése alapján 2030-ra az MI vizsgált ágazatai 600 milliárd dollárral növelik az ország gazdaságát. A kutatók 2021. októberi és novemberi piaci adatokat elemeztek, és ötvennél több szakértővel készítettek interjút.

A „piacra kész” (és nem a korai szakaszban lévő, illetve a már beérett) MI technológiákra – és alkalmazási területeikre – összpontosítottak, azok valószínűsíthető legnagyobb hatását vizsgálták. Kiderült, hogy ezek közül a szállítás, a gyártás, a vállalatiszoftver-fejlesztés és az egészségügy járul hozzá leginkább az ország gazdasági növekedéséhez.

chinaai0.jpg

A járműipari és logisztikai hasznosulásokat is tartalmazó szállítás 64 százalékot tesz ki ebből. Az önvezető autók 335 milliárd dollárt generálnak, és ebbe beleértik a használatukkal járó kevesebb balesetet, a mentőkre és a kórházi kezelésre költött kisebb összegeket is. Az MI lehetővé teszi a járműflották hatékonyabb kezelését és az eredményesebb útvonal-tervezést is.

A gyártás 19 százalékot jelent. A legnagyobb, százmilliárdos tételt a hatékonyságot és a termelékenységet növelő innováció, például összeszerelő robotok és a dolgozókat monitorozó viselhető technológiák adják.

Vállalati szoftverek fejlesztése 13 százalékot generál. Alig több mint a fele felhőmegoldásokra és MI programokra, a maradék pedig a szoftverre, mint szolgáltatásra (software as a service, SAAS) vonatkozik.

Az egészségügyi MI a gyógyszerfejlesztésben, klinikai tesztekben, beteggondozásban és más alkalmazásokban segít. Ez teszi ki a maradék négy százalékot, kb. 25 milliárd dollárt.

Persze ez még nem minden, mert tényleg bámulatos a fejlődés, viszont egyes problémák – csúcsminőségű adatok használata, szellemi tulajdonjogok védelme, értő munkaerő képzése – megoldásával többet kellene foglalkozniuk a kínai szakembereknek.

Hogyan ismerjük fel a félrevezető információt?

A tényellenőrök nem tudják tartani a tempót az egyre nagyobb mértékű félretájékoztatással, dezinformációval, és a mesterséges intelligencia sem teljesít jól online tartalmak moderálásában.

A Facebook algoritmusai például csökkentik a fogyatékkal élőknek készült hirdetések számát, ugyanakkor gyakran szemet hunynak az erőszakra való buzdítás felett. Úgy tűnik, hogy a lépésről lépésre történő fejlesztésekkel mégis tehetünk valamit az oltásellenes hangok, a klímakatasztrófa tagadása és más káros online tartalmak terjedése ellen.

misinformation.jpg

A webet elömlesztő hamis információkra reagálva, a Google frissítette a keresési eredményeket rangsoroló algoritmus mögötti egyik fontos modellt. A módosításokkal el akarják érni, hogy csökkenjen a keresési eredmények tetejéhez közeli dezinformáció. Apró, de fontos részletekről, információdarabkákról, kivonatokról (snippets) van szó.

A Google kutatói az úgynevezett Többfeladatos Egyesített Modell felülvizsgálatával igyekeznek ellenőrizni a részletek pontosságát.

misinformation0.jpg

A modell kiértékeli, hogy a legjobb eredmények mennyire egyeznek. Még akkor is képes összehasonlítani oldalakat egy adott témában, ha azok különböző mondatokat és példákat használnak. Ha különösebben nem bízik a rendelkezésre álló forrásokban, kivonat helyett figyelmeztetést generál, például: „úgy tűnik, nincs sok nagyon jó találat ehhez a kereséshez.”

A félrevezető kérdéseket szintén felismeri. Például az olyanokat, hogy „mikor ölte meg Snoopy Dog Abraham Lincolnt?” A frissítés máris hasznosnak bizonyult, mert negyven százalékkal csökkent az ilyen lekérdezésekre adott hibás információdarabok száma.

misinformation1.jpg

A Google nem az egyetlen infokom nagyvállalat, amelyik mesterséges intelligenciával próbálja szűrni a dezinformációáradatot. A Facebook multimodális tanulással igyekszik detektálni a Covid-19-cel kapcsolatos hamis állításokat. A YouTube 2020 óta használ az összeesküvéselméleteket és a tudományellenes félretájékoztatást tartalmazó videók ajánlásait leminősítő osztályozót.

Az MI összességében hasznos eszköz a keresési eredmények és maguk a keresők hitelességének megőrzésében, de egyedül nem tud megbirkózni a feladattal. Nagyjából úgy, mint ahogy az önvezető taxikkal dolgozó vállalatok is alkalmaznak (helyszíni vagy távirányító) humán sofőröket.

Az automatizált tartalommoderáló rendszereknek egyelőre komoly segítséget jelent, ha ember is van a közelükben.

Termeszek utánzása új anyagok előállításához

A Caltech (Kaliforniai Technológiai Intézet) kutatóit a természet, a termeszek „várépítése”, növekedési mintázatok inspirálták új anyagok fejlesztésére. Az ellesett szabályok követésével speciális, programozható tulajdonságokkal rendelkező anyagok hozhatók létre.

A csak néhány milliméter hosszú termeszek akár négy méter magas „várakat” építhetnek. Az építmények belseje aszimmetrikus, egymással összekötött szerkezetek hálózata, olyan, mint a kenyér vagy a szivacs belseje. Por, homokszemek, szemét, nyál és trágya az alkotóelemeik, de a szabálytalan, kaotikus szerkezetek stabilitása és szellőzése mégis optimalizált.

termites.jpg

A kutatók abból indultak ki, hogyha megértik a termeszek építkezését, az egyszerű szabályok alapján egyedi anyagokat tervezhetnek. Az épített anyagok a nanotól a mikroméret-tartományig terjedő, habszerű vagy szilárd kompozitok, amelyek 3D szerkezetekbe szervezhető építőkockákból állnak.

Épített anyagok kidolgozásánál eddig a periodikus architektúrákra összpontosítottak. Ezek egységes geometriájú sejtet, például oktaédereket vagy kockákat tartalmaznak, majd az egység többszöri megismétlésével rácsszerkezetek hozhatók létre. A rendezett szerkezetek viszont korlátozzák az épített anyagok funkcionalitását, használatát.

A periodikus architektúrák azért kényelmesek mérnököknek, mert tulajdonságaik könnyebben elemezhetők. Alkalmazás szinten viszont nem feltétlenül optimális választások. A rendezetlen szerkezetek, mint a termeszek várai sokkal elterjedtebbek a természetben, gyakran funkcionálisabbak is, eddig viszont nem találtak ki optimális tervezőmódszert rájuk.

termites0.jpg

A termeszek korlátozott erőforrásai a kiindulási pont – az állatok minta és terv nélkül dolgoznak, csak helyi szabályok alapján képesek döntéseket hozni. Ezek az alapszabályok határozzák meg az építkezésüket, a kutatók ezek alapján fejlesztettek „virtuális növekedés programot”, a biológiai szerkezetek természetes növekedését, a termeszek építkezését szimuláló algoritmust. Az algoritmus egyedi anyaggeometriával és az anyagok használati utasításával dolgozik. Minden egyes anyagnak (L-, I-, T- és +alakú építőkockának) megvannak a maga korlátai.

Ezekkel a megszorításokkal, a program egy hálóra épít architektúrát, majd az architektúrák 2D-s vagy 3D-s fizikai modellekké, szabálytalan geometriákká alakíthatók, kinyomtathatók.

A program által alkotott, a termeszvár véletlenszerűségét utánzó geometriák egyediek. Összesen 54 ezer szimulált mintát generáltak, a mintákat különféle mechanikai tulajdonságokkal rendelkező csoportokba klaszterezték, az anyagok, az erőforrások és a mechanikai tulajdonságok kapcsolatait gráfokkal ábrázolták. A kutatók mindezekből következtettek a rendezetlen szerkezeteket megalapozó szabályokra, amelyek teljesen új keretet adnak anyagok elemzéséhez és tervezéséhez. Ezek az új anyagok jobban teljesíthetnek, mint a ma használatban lévők, például jóval könnyebbek náluk, de nehezebben törnek, jobban tűrik a mechanikai impulzusokat, rezgéseket stb.

Az algoritmus nem a várat, hanem a várépítési módszert reprodukálja – hangsúlyozzák a kutatók.

Hogyan építsünk digitális várost?

A virtuális városépítéssel 1989-ben, az első SimCity megjelenésekor ismerkedtünk meg. A mai technológiákkal már nemcsak Sims-féle karaktereket irányíthatunk, hanem saját magunk is ilyen karakterekké válhatunk. Csakhogy a jelenlegi internet még 2D-s, a Mark Zuckerberg és mások által elképzelt metaverzum viszont a világháló élő és 3D-s változata.

Technológiai cégek, kormányok és szervezetek egyre gyakrabban generálnak metaverzum-szerű terekre alkalmas 3D világokat. Zuckerberg még májusban be is jelentette, hogy cége komoly összegeket fektet ilyen világok létrehozásába, és tisztában van vele, hogy rövidtávon nem térül meg a befektetés.

virtualcity.jpg

Egyes szakértők szerint több évtized eltelik mindaddig, amíg a metaverzum beteljesíti a benne rejlő potenciált, és hibátlanul működik.

Egyes városok viszont már ma is létrehoznak virtuális környezeteket lakóik számára. Szöul például a Vision 2030 terv részeként, hárommillió dollárt fektetett egy ilyen projektbe. Dubai 2030-ra a világ tíz vezető „metaverzum-gazdaságának” egyikévé kíván válni. A karib-tengeri Barbados digitális nagykövetséget rendezett be a Decentraland nevű virtuális platformon.

virtualcity1.jpg

Elsőként, még 2018-ban, a finn főváros lépett a ZOAN VR-stúdió által alkotott Virtuális Helsinkivel, „Helsinki központjának digitális ikertestvérével.” A felhasználók virtuálisvalóság-headsettel járkálhatnak benne. 2020 májusában, a pandémia miatti lezárások alatt a finn lakosság több mint tíz százaléka vett részt egy ottani koncerten.

A metaverzum-városok koncepció megvalósítása mindezek ellenére gyerekcipőben jár még, a szakértők viszont mind egyetértenek, hogy a VR, a kibővített valóság (AR) és a kevert valóság technológiák összeintegrálódásával, az ormótlan sisakok, nem felhasználóbarát interfészek eltűnésével, hatalmas üzleti potenciál rejlik bennük: bevásárlásra, közösségi eseményekre, fitnesz-gyakorlatokra, találkozókra, oktatásra és kereskedelmi tevékenységekre alkalmas terek.

„Képzeljük el, hogy az irodában vagyunk, és nem kell utaznunk hozzá” – magyarázza Zuckerberg.

Egyelőre azonban inkább csak szórványos VR-eseményekről (kiállítások, Gucci-bemutatók, Snoop Dogg és más zenészek koncertjei) hallunk, de maga a virtuális metropolisz, a metaverzum, mint város koncepcióhoz ezeknek semmi közük. A szimultán többmillió személy által benépesített, személyre szabott környezetekhez a szükséges számítási kapacitás sincs még meg.

Pedig a közvélemény-kutatásokban megkérdezettek zöme szimpatizál a metaverzummal. A McKinsey szerint a közeg értéke 2030-ra elérheti az öttrillió dollárt, a meginterjúvolt üzletemberek 95 százaléka szerint a metaverzum releváns és pozitív, 25 százalékuk már a közeljövő bevételt generáló platformját látja benne.

Az Irvine-i Kaliforniai Egyetem kutatói szerint a SimCity és más videójátékok mögötti elvek, például a szocializáció és a digitális közösségek építése modellként szolgálhat a jövő metaverzum-szerű tereihez.

Nem ismernek fel az arcfelismerők, ha több évet öregedtünk

Ha csak öt évet öregedtünk, az arcfelismerő algoritmusoknak máris komoly problémát okoz az azonosításunk, mert esetleg nem ugyanazt a személyt látják, mint a régebbi képeken. Ez azt jelenti, hogy a technológián alapuló rendszereknek elvileg új képeket kell használniuk, periodikusan újakat kell feltölteni az adatbázisukba, máskülönben igen komoly problémákkal szembesülhetnek. Rosszabb esetben használhatatlanná válnak, nem töltik be rendeltetésüket.

Jelenleg főként határátkelőkön, repülőtereken, bűnelkövetők, szabálysértők rendőrségi azonosításakor használják őket. Az egyéni felhasználó szempontjából azonban sokkal fontosabb, hogy telefonunkon és más online rendszerekbe, például a bankunkba történő bejelentkezéskor is gyakori az arc alapján való azonosítás.

aecfelismeres.jpg

Sajnos kevés a problémával kapcsolatos kutatás.

Mivel a kereskedelmi forgalomban használt rendszerek fejlesztőcégei nem árulják el, hogy hogyan működnek az algoritmusaik, a téma tanulmányozásához nyílt forrású eszközök vizsgálata a legjobb megoldás. A Norvég Tudomány és Technológia Egyetem Marcel Grimmer által vezetett kutatócsoportja velük, valamint 50 ezer személy referenciaképeivel, illetve mesterséges intelligencia által generált szintetikus „öregedési folyamatáról” készült fényképekkel dolgozva, vonta le következtetéseit.

A tesztek során kiderült, hogy az évek múlásával egyre problémásabb a rendszerek működése. Öt év öregedés az a pont, ahol valóban elbizonytalanodnak, és kezdenek hibákat véteni. Húsz év után pedig nagyon kevés az esély arra, hogy jó eredményt produkáljanak.

Az adott személy kora más szempontból szintén fontos: húsz alatt, illetve hatvan felett olyan gyorsak a változások, hogy a rendszerek bizonytalanabbak, mint például a húsz és negyven közötti személyek esetében.

„A csecsemők kéthavonta változnak, tehát az arcfelismerő még akkor is tévedhet, ha havonta teszünk fel új képet. Hatvan felett pedig megváltozik a fej formája, több a ránc stb.” – magyarázza Grimmer.

Kézenfekvő megoldás lenne, ha rendszeresen töltenének fel arcképeket a rendszerekbe. Kérdés persze, hogy a rendszerek mennyire tudnák kezelni a képmennyiséget, illetve még fontosabb, hogy a feltöltések szinkronban lennének-e a magánéletre (privacy) vonatkozó törvényekkel.

Dél-Korea: öt év alatt egymillió szakképzett munkaerő a digitális iparnak

Dél-Korea nemrég döntötte el, hogy a következő tíz évben 150 ezer személy végzi el a félvezető-szakértelemhez szükséges felsőoktatási tanulmányokat. Most még ambiciózusabb tervvel álltak elő: az oktatási miniszter bejelentette, hogy a következő öt évben, 2026-ig egymillióan tanulják meg, sajátítsák el azokat az ismereteket, amelyekkel a digitális ipar szakembereivé válnak.

Közben az információtechnológiai tantárgyak óraszámát az általános és a középiskolákban is megduplázzák – általános iskolákban 17-ről 34, középiskolákban 34-ről 68 órára –, és az iskoláknak számítógépes programozói tantárgyat is kötelező lesz tanítaniuk. A szoftveroktatás mellett hamarosan a mesterséges intelligencia szintén kötelező tárgy lesz.

southkorea.jpg

Az Oktatási Minisztérium szerint a helyi digitális iparban (beleértve mesterséges intelligenciát, blokkláncot, mindenféle szoftvert, big datát, metaverzumot, felhőszámítást, dolgok internetét, 5 és 6G-t stb.) 738 ezer szakképzett munkaerőre lesz szükség a következő öt évben.

Mivel más iparágakban is egyre nő a digitális platformok szakértői iránti kereslet, könnyen elképzelhető, hogy a 738 ezer nem is elég, és valójában több személyre lesz igény. A keresletnek csak a digitális oktatás növelésével, minőségének javításával lehet eleget tenni.

Az egymillióból 160 ezren a felsőoktatás alapszintjét érik majd el, 710 ezren három-négyéves tanulmányokat végeznek, 130 ezren pedig a mesterképzésig, doktoriig tanulnak.

A minisztérium megszüntet a digitális szektorhoz kapcsolódó szakokra vonatkozó minden kvótát. A félvezető tanszékekhez hasonlóan ezekre a tanszékekre is felvesznek mindenkit, aki megfelel a követelményeknek.

A kapcsolódó középiskolai, főiskolai képzést mesterséges intelligenciával, virtuális valósággal, cyberbiztonsággal és big datával egészítik ki.

A minisztérium elképzelései alapján az általános iskolások játékszerű aktivitásokon keresztül tanulják meg a számítógépes nyelveket, a középiskolások a való világ problémáit kezelik a programozással, míg a felsőoktatásban tanulók algoritmusokat fejlesztenek majd.

2022 programozási nyelvei

Az IEEE Spectrum szakportál immáron kilencedik alkalommal készítette el éves programozási nyelv toplistáját. Idén átalakították, finomhangolták az interaktív rangsoroló programot, különféle források mérési módszereit kombinálva, még változatosabb paramétereket figyelembe véve becsülték meg a programozási nyelvek népszerűségét.

Egy rangsorolás (lásd a 2. ábrát) hiába tűnik evidensnek, a valóságban nagyon nem az. A határesetek és a szokatlan hibridek miatt minél diverzifikáltabb, annál hitelesebb a módszer. Például a hasonlóságokra vagy az eltérésekre célszerűbb összpontosítani? Vagy mikortól tekinthető egy sokadik variáns önálló nyelvnek?

programnyelvek.jpg

Mi tekinthető egyáltalán programozási nyelvnek? Megoszlanak a nézőpontok, és sokak véleményével ellentétben, az IEEE Spectrum a HTML/CSS-t például annak tartja.

Új és régi módszerrel egyaránt, a tavalyihoz hasonlóan a Python idén is változatlanul vezeti a listát, de a C szorosan ott van a nyomában, sőt, a C és a hasonló nyelvek (C++, C#) együttes pontszáma valamivel magasabb, mint a Pythoné. A Java és a Javascript sem veszített népszerűségéből, utóbbit az egyre bonyolultabb weboldalak és böngészőn belüli eszközök teszik különösen fontossá.

programnyelvek0.jpg

A nagyágyúk mellett figyelemreméltó az SQL növekvő népszerűsége. Nem véletlen, hogy egyre több álláshirdetésben keresnek csak SQL-programozót, és még többen valamilyen nyelvhez plusz SQL-hez értő szakembert.

Az IEEE Spectrum szerint nem ez a legelbűvölőbb nyelv, és valószínűleg nem fogjuk használni a következő világmegváltó algoritmus megírásához, viszont aranyat ér, ha rendelkezünk SQL-ismerettel, tapasztalattal.

Ez azért lehet, mert manapság sok alkalmazáshoz van a háttéradatbázissal (a helyi erőforrás-korlátokat kiiktatandó, gyakran hálózaton keresztül) kommunikáló előtér- és middleware-réteg. Viszont teljesen felesleges meghackelni a saját adatbázist és a kapcsolódó hálózati interfész-protokollt, ha hozzáférhető egy csomó SQL-implementáció. Nagy az esélye, hogy valamelyik passzol is nekünk.

Fiktív szavakkal átverhetők a képeket generáló ideghálók

Egyes ellenséges generatív hálózatok (GAN) által létrehozott képek rendeltetése a gépilátás-rendszerek megtévesztése. Az általuk létrehozott mintázatok alkalmasak az egyébként hatékony arc- és tárgyfelismerő rendszerek átvágására, olyan dolgokat és arcokat értelmeznek félre, amelyeket különben simán azonosítanának.

Ilyen trükközéssel hackerek kijátszhatnak biztonsági rendszereket. De vajon a szöveget képpé alakító algoritmusok, speciálisan gyakoroltatott ideghálók is ennyire könnyedén átverhetők?

Raphaël Millière, a Columbia Egyetem mesterségesintelligencia-kutatója szerint igen. Rájött, hogyan lehet fiktív szavakkal úgy kijátszani őket, hogy a rendszer speciális válaszokat generáljon.

nonsense0.jpg

Az utóbbi hónapokban ezek a rendszerek annyit fejlődtek, hogy a felhasználó például begépeli az „űrhajós lovagol” mondatot, és meglepően élethű képet kap. A rendszerek nem tökéletesek, de mégis lenyűgözőek.

Nonszensz szavakkal, például Lewis Carroll egyes verseivel az emberek is átejthetők, mert speciális képek ugranak be róluk. Millière azt tanulmányozta, hogy a szövegből képet létrehozó algoritmusok is ugyanígy sebezhetők, vagy sem. Sajátos technikát dolgozott ki fantáziaszövegekhez – a „macaroni prompting” különböző nyelvek létező szavaiból hoz össze valamit. A szikla angolul cliff, németül Klippe, olaszul scogliera, franciául falaise, spanyolul acantilado, az új szó pedig „falaiscoglieklippantilado.”

Meglepetésére, amikor a DALL-E 2-nek begépelte a kamuszót, a rendszer sziklákat ábrázoló képsorozattal állt elő. Utána ugyanezzel a módszerrel más szavakat alkotott, és az eredmények is hasonlók voltak. Minden egyes esetben DALL-E 2 az angol szó alapján generált élethű képeket.

nonsense.jpg

A kutató mondatokat is alkotott a kamuszavakból. Az eredmények megint az értelmesen értelmetlen mondatra rímeltek, azaz lényegében hibrid nonszensz szövegekkel szinte bármiről készíthető kép. Ha a szövegeket összekombináljuk, még komplexebb képek születnek (2. ábra).

Ez azért is lehetséges, mert sok képet több nyelven címkéznek fel, így a fiktív szavak rendelkeznek olyan információkkal, amelyeket a rendszer képes dekódolni, ami biztonságtechnológiai szempontból aggasztó – a szóalkotó technikával különféle szűrők játszhatók ki, és káros (rasszista, uszító stb.) tartalmak jeleníthetők meg.

Millière javaslata: ha nem akarunk bizonyos képeket, a gyakorló adatsorból szedjük ki az összes példát, vagy az algoritmus közzététele előtt ellenőrizzük valamennyi képet.

A szövegből képet generáló rendszerekkel egyelőre korlátozott a felhasználói interakció. A Google például nem tette közkinccsé a két legfejlettebbet (Parti, Imagen), és a DALL-E 2 (OpenAI) hozzáférhetősége is korlátozott.

A jövőben viszont egész biztosan széles körben elterjednek. Fontos, hogy gyengeségeikkel és korlátaikkal is tisztában legyünk, mert nagyon nem mindegy, hogyan, milyen szabályozói környezetben használjuk majd őket.

süti beállítások módosítása