Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Álvideókat készít a mesterséges intelligencia

2017. december 12. - ferenck

A Nvidia októberben mutatott be egy soha nem létezett személyekről zavaróan élethű képeket generáló mesterséges intelligenciát. A techcég most továbbment, legújabb MI-jük ugyanis álvideókat hoz létre.

Meglepően jól dolgozik, nappalt éjszakára, telet nyárra, házimacskát gepárdra és vice versa változtat. Szintén figyelemreméltó, hogy eredményeit sokkal kevesebb gyakorlással éri el, mint a meglévő hasonló rendszerek.

fake.jpg

Az arcgenerátorhoz hasonlóan, a képfordító MI szintén „generatív ellenséges hálózatot” (generative adversarial network, GAN) használ. Az algoritmusban két idegháló dolgozik együtt, de egymás ellen. Az egyik képet vagy videót generál, a másik „megkritizálja” a munkáját.

Egy GAN hatékony működéséhez általában sok felcímkézett adat kell, hogy megtanuljon belőlük saját adatot készíteni. Például, a rendszernek képpárokat kell látnia egy utcáról hóval és hó nélkül ahhoz, hogy aztán magától alkosson mindkettőről képet.

A Nvidia új képfordító MI-jének viszont nem kell látnia, hogyan néz ki a hó borította utca, mert el tudja képzelni.

fake2.jpg

Ming-Yu Liu, az egyik fejlesztő a rendszer konkrét hasznosításáról semmit nem árult el, viszont több izgalmas alkalmazási lehetőséget villantott fel.

„Kaliforniában például ritkán esik az eső, és természetesen szeretnénk, ha önvezető autóink esőben is szabályosan működnének. Ezzel a módszerrel a napsütötte kaliforniai vezetési jelenetsorok esősekké alakíthatók át, és önvezető járműveink gyakorolhatnak rajtuk” – magyarázza.

Az MI a nagyon praktikus alkalmazások mellett más célokra is használható: képzeljük el, hogy házat akarunk vásárolni, és a szokásos tavaszi-nyári háttér után megnézzük, hogyan mutat ősszel vagy télen a kiszemelt épület. Esetleg szabadtéri esküvőt is megcsodálhatunk őszi esőben…

Fantáziánkat nem kell különösebben elereszteni ahhoz, hogy a technológia árnyoldalait is észrevegyük. Ha széles körben elterjed, még kevésbé bízunk meg a hírekben, videókban, és végül csak a saját szemünkkel látottakat hisszük el. De nemcsak mi, hanem a bíróságok sem biztos, hogy elfogadják a videókat, az álhírek pedig még kevésbé lesznek különböztethetők meg az igaziaktól.

Az Nvidia MI képességei egyelőre azonban csak néhány alkalmazásra korlátozódnak, és amíg nem kerül a fogyasztók kezébe, nem tudhatjuk, milyen társadalmi hatásai lesznek.

MIT-kutatók „élő tetkót” nyomtatnak

Genetikailag programozott élő sejtekből álló „tintával” működő 3D nyomtatótechnikát dolgoztak ki az MIT (Massachusetts Institute of Technology) Gépészmérnöki Karán. A sejtek különféle ingerekre világítani kezdenek. Hidrogéllel és tápanyagokkal keverve nyomtathatók rétegről rétegre, míg végül háromdimenziós interaktív szerkezeteket és eszközöket formáznak. Bőrre ragasztva ugyanezek a vegyületek lépnek működésbe, és a fát formáló minta megfelelő része világítani kezd.

A kutatók szerint technikájukkal „aktív” anyagok gyárthatók magunkon viselhető (wearable) szenzorokhoz és interaktív kijelzőkhöz, gyógyszerkapszulákhoz, sebészeti beültetésekhez. Később „élő komputerek” szintén fejleszthetők lesznek velük. A sejtek érzékelnék a környezet vegyi, szennyező anyagait, a pH-értékek és a hőmérséklet változását, és úgy továbbítanának jeleket egymásnak, mint a tranzisztorok egy mikrochipen.

mit.jpg

A csoport az adott 3D szerkezeten belüli sejtek (különböző feltételek melletti) egymás közötti interakcióit előrejelző modellt is kidolgozott. A modell reagens (responsive) élő anyagok tervezésére használható. Az utóbbi években több ilyennel kísérleteztek 3D nyomtatótintákhoz: „hőmérséklet-érzékeny” polimerekkel próbáltak például hőmérsékletre reagáló alakváltó, vagy a fényviszonyok függvényében összezsugorodó/kitáguló tárgyakat printelni.

A biomérnökökkel együttműködő kutatók rájöttek, hogy élő sejtek, különösen a géntervezéssel készültek szintén képesek különféle ingerekre reagálni. Nem ők az egyetlenek, mások emlőssejtekkel próbálkoztak – kevés sikerrel. Az emlőssejtek túl vékonyak és törékenyek voltak, el is pusztultak nyomtatás közben.

mit0.jpg

Az MIT-s csoport baktériumokban azonosított egy keményebb és a legtöbb hidrogéllel kompatibilis sejttípust. A hidrogél azért kell, mert megfelelő „vizes” környezetet biztosít. Teszteken a (3D nyomtatásra is) legideálisabb hidrogélt szintén azonosították.

A „3D gyár munkásaiként” dolgozó bakteriális sejteket úgy tervezték, hogy különféle ingerekre fényt bocsássanak ki, majd a baktériumokból, a hidrogélből és tápanyagokból elkészítették a tinta „receptjét”, ügyelve, hogy a sejtek és funkcióik is megmaradjanak.

Kiderült, hogy a tinta működik, és nagyfelbontásban nyomtathatnak vele. Minden egyes printelt réteg néhány sejtet tartalmaz, és akár átlagos gépen is relatíve nagy – több centiméteres – szerkezetek készíthetők belőle.

Bemutatóként a hidrogél és a sejtek keverékéből elasztomer rétegre nyomtattak egy faformájú mintát. Az utómunkálatokat követően ultraviola sugárzásnak tették ki, majd az átlátszó elasztomert (az élő mintákkal) bőrre ragasztották. A tesztalany tenyerére többféle vegyületet tettek, és amikor a baktériumok észlelték a megfelelő ingereket, fényt bocsátottak ki magukból.

Mesterségesintelligencia-index méri a terület fejlődését

A mesterséges intelligencia kifejezés első, 1956-os használata óta főként vezető nélküli autók, szóbeli utasításokat felismerő okostelefonok és látó számítógépek formájában, ha nem is úgy, ahogy elképzelték, de valósággá fejlődött. Ezt a fejlődést igyekszik számszerűsíteni a Stanford vezető MI-kutatókból álló AI100 (One Hundred Year Study on Artificial Intelligence) csoportja. Az index átfogó képet ad az MI állapotáról, és ugyanúgy méri a technológiai fejlődést, mint a GDP a gazdaságot, az S&P 500 a tőzsdét, vagy a szintén nehezen számszerűsíthető társadalmi haladást, közép-keleti békét, Banglades szegénységét stb. számszerűsítő technikák.

A kezdeményezés kiegészíti az AI100 rendszeres beszámolóját a terület helyzetéről. Magát az AI100-at három éve alapították, 2016 őszi első beszámolója a 2030-as állapotokat vetítette előre. Az új index az MI startupok számának és a befektetéseknek drámai növekedését, a technológia komoly javulását állapította meg.

stanfordai.jpg

Az index legalább 18 oktatási, ipari, nyílt forrású szoftveres, közérdekű tényezőt, valamint az „emberi szintű teljesítmény” felé tartó technikai fejlődést méri olyan területeken, mint a beszédfelismerés, kérdés-felelet, gépi látás stb. A publikált tanulmányokat, tanfolyamokat, startupokat, állásokat, keresési szavak gyakoriságát, médiavonatkozásokat stb. speciális mutatók alapján értékelik.

„Sok szempontból vakon vitázunk az MI-ről, hiányoznak a gépi tevékenység hiteles értékeléséhez nélkülözhetetlen adatok. Az index célja a tényalapú mérés, amellyel felvázolhatjuk a fejlődést, és mélyebb beszélgetéseket folytathatunk a terület jövőjéről” – jelentette ki az indexet és az AI100 vezetőbizottságát megálmodó stanfordi professor emeritus Yoav Shoham.

stanfordai0.jpg

Az első eredmények között szerepel, hogy 2017-ben 14-szer annyi MI startup működik, mint 2000-ben. A kockázati tőkebefektetések meghatszorozódtak, az akadémiai közegben kilencszer annyi MI-témájú tanulmányt publikálnak, mint 20 éve, jóval többen iratkoznak be MI-tanfolyamokra, a Stanfordon például bevezető gépitanulás-kurzusra 45-ször annyian iratkoznak be, mint 30 éve.

A technikai méréseket illetően, a kép- és a beszédfelismerés egyaránt megközelíti, sőt, időnként túl is szárnyalja az emberi szintű teljesítményt. MI-rendszerek olyan „valóvilág” alkalmazásokban remekelnek, mint a tárgydetektálás, kérdés-felelet játékok megértése, bőrrákos sejtekről készült fényképek csoportosítása stb. A probléma, hogy a számítógépek változatlanul le vannak maradva speciális információk általánosításában, mélyebb jelentések megértésében. Hiányzik belőlük, vagy nagyon alacsony szintű ez a képesség.

„Az MI döbbenetes haladást ért el az elmúlt 10 évben, viszont nincs meg bennük az ötéves gyerekek józanész-bölcsessége, általános intelligenciája” – magyarázza Shoham, majd megjegyezte, hogy a beszámoló nagyon USA-központú, és nemzetközibbnek kellene lennie. A kockázati tőke mellett a kormányzati és a vállalati beruházásokat szintén célszerű lenne mérni.

A grafén lehet a tiszta és korlátlan mennyiségű energia kulcsa

Az Arkansas Egyetem fizikusai a grafén mozgását tiszta és korlátlan mennyiségű energia termelésére használó, nanoméretű áramgenerátort találtak fel. A Rezgőenergia-gyűjtő fejlesztése bizonyítja azt az elméletet, mely szerint kétdimenziós anyagok felhasználható energia forrásai lehetnek.

Az egyetemen fizikát oktató Paul Thibadonak onnan jött a generátor ötlete, hogy kollégáival nagyon furcsa mikroszkopikus mozgásokat vettek észre (egyrétegű szénatomokból álló) grafénlapokon. A rézállványra helyezett lapokról készült mikroszkópos képek összezavarták őt is, munkatársait is.

grafen.jpg

A képeket alképekre bontották, hogy jobban megértsék a nagy egész által elrejtett mintákat. Eredménnyel jártak, mert az új képeken értelmezhetőbb mintázatot figyeltek meg.

A lap pontról pontra történő vizsgálata közben döbbenetes jelenséget fedeztek fel. A grafén fel- és lefelé hullámzott, csúszott. E tevékenységet apró, véletlen és nagyobb, hirtelen mozgások kombinációjával érte el. Ilyen mozgást most figyeltek meg először atomi szintű szervetlen rendszeren. A kutatók megállapították, hogy a mozgásokat a környezet hőhatása váltotta ki (a megfigyelést szobahőmérsékleten végezték).

grafen0_1.jpg

A grafén lapszerű szerkezete miatt atomjai – ellentétben például a folyadékmolekulák véletlenszerű rezgéseivel – párhuzamosan rezegnek. Thibado szerint ez a kulcs ahhoz, hogy 2D anyagok összegyűjthető energia forrásai lehetnek. A tandemszerű, párhuzamos rezgések okozzák a hullámzást a lapokon, amelyekről a legújabb nanotechnológiai módszerekkel gyűjthető energia.

A generátort kifejezetten erre a célra fejlesztették. Nemcsak az energiagyűjtésre, hanem az információ küldésére, fogadására, kezelésére és tárolására is óriási hatással lehet, több területen alkalmazhatják. Semmi más nem kell hozzá, csak szobahőmérsékleten generált hő.

Az alkalmazások előtt számos teszten át kell esnie, és a prototípusból is szélesebb körben működő energiaforrást kell kidolgozni. Ha beválik, az energiatermelés mellett az eszközkészítést is forradalmasíthatja.

Az orvosi eszközök, például bioimplantátumok, hallókészülékek, pacemakerek és magunkon viselhető szenzorok az egyik lehetséges alkalmazási kör. A grafén mozgásán alapuló, önmagát töltő eszközök kisebbek és hosszabb távon hatékonyabbak is lehetnek.

A generátor természetesen az egészségügyön kívül, például „intelligens” ruhához, fülbe ágyazott fordítógéphez stb. is hasznosítható.

Interaktív gyalogátkelő

Képzeljünk el egy, csúcsforgalomban automatikusan működésbe lépő, a járókelőket segítő, csendes órákban viszont eltűnő gyalogátkelőhelyet. Ha közben játszunk az okostelefonon, a veszélyre minket és az autóvezetőket is figyelmeztető minta jelenik meg a földön.

Ez a zebra reagál a gyalogosokra.

A londoni Umbrellium pont ilyen interaktív, a környezetre dinamikusan reagáló gyalogátkelőt tervezett (Starling Crossing). Logikusnak tűnik, hogy a közeljövőben efféle interakciókat folytatunk városi terekkel.

zebra.jpg

„Ha körbenézünk a városokban, azt látjuk, hogy a technológia sokféleképpen kezeli egymáshoz és az urbánus térhez való viszonyunkat. A jól ismert zebrákat viszont évtizedekkel ezelőtt tervezték, és ma már másként használjuk a várost. Érdekes, hogy a zebrákat nem újították meg” – elmélkedik Usman Haque, az Umbrellum alapítója.

Az 1940-es évek Angliájában kidolgozott gyalogátkelőket mindenki ismeri. Az új fejlesztés a 23x7.5 méteres vízhatlan LED-lámpákból álló, az útba ágyazott hálózat jóvoltából meghagyja a zebra-mintát, viszont kívánság szerint alaprajzát, méretét, sőt, a színét is képes megváltoztatni.

A reagáló (responsive) felület az út kivilágításával védi, figyelmezteti a veszélyre, és irányítja biztonságosan a gyalogosokat a túloldalra.

zebra0.jpg

A két szemközti oldalon, az egymástól legtávolabbi két ponton két kamera másodpercenként 25 képet készít az útról. A rendszer feldolgozza a fotókat, különbséget tesz gyalogosok, biciklisek és autók között. Osztályozórendszere ugyanis megtanulta, hogyan néznek ki különböző nézőpontokból személyek, kerékpárok és járművek.

Ezen információk alapján hozza meg döntéseit. Arra is figyelmeztet, ha az autó lámpája miatt rosszabbul látunk, ha pedig idősebb személyt észlel, hosszabb ideig világítja ki a zebrát.

A rendszer működésének egyik alapelve a folyamatos tanulás.

„Ha mindig rossz helyen megyünk át, közelebb viszi ehhez a helyhez a zebrát, hogy biztonságosabb legyen az átkelés” – magyarázza Haque.

A prototípust egy dél-londoni utcán tesztelték októberben, egy hónapig. A felhasználói visszajelzések pozitívak voltak. A cégnek most ki kell dolgoznia, hogy az okos gyalogátkelőt hogyan alkalmazzák világszerte.

 

Angelina újfajta videojátékokról álmodozik

Michael Cook, a délnyugat-angliai (cornwalli) Falmouth Egyetem kutatója 2011-ben fejlesztette Angelinát, a szinte semmiből videojátékokat kitaláló mesterséges intelligenciát. Az elmúlt években az MI többszáz kísérleti játékot gyártott le. Super Mario Bros stílusú platformjátékokkal kezdte, repertoárja mára viszont jócskán bővült; más műfajokban, például puzzle-ban és kalandjátékokban is kompetens.

Cook eleve nem úgy tervezte, hogy csak egy műfajban alkosson.

Az MI szabadon használható gyűjteményekből (Wikimedia Commons stb.) összeszedett képekből képes játékokat generálni, online híroldalakról és a közösségi médiából kiválasztott anyagokra épülő feltételeket, szabályokat és karaktereket létrehozni. Ezeket az információkat önálló alkalmazásként futtatható szövegfájlba teszi.

angelina.jpg

„Angelina megpróbál a saját jó játék értelmezésének megfelelő anyagokat alkotni” – magyarázza Cook. Minél érdekesebb dolgokat fedez fel kísérletezés közben, annál inkább belemélyül a projektbe.

Angelina az egyik legszemléltetőbb példája egy nem teljesen új, de az utóbbi években egyre markánsabb trendnek: kutatók mind kifinomultabb géptanulás-algoritmusokat alkalmaznak játéktervezésre.

angelina0.jpg

Hasonló algoritmusok már a korai videojátékok idején, az 1980-as évek elején is léteztek, használatukat viszont helyszínek kialakítására és más egyszerűbb megoldásokra korlátozták.

A legtöbb mai félautomata játékkészítő rendszert humán tervezők segítik. Kétfajta tartalmat hoznak létre: az egyik „kidobható”, magyarán nincs komoly hatással a játékosra, semmi különleges pluszt nem ad hozzá a játékmenethez. Terepek, sztereotip ellenségek, kisebb küldetések tartoznak ebbe a kategóriába. A másik az „emlékezetes” tartalom: a legfontosabb szörnyek, a cselekmény kiemelkedő pontjai stb. Előbbivel évtizedek óta foglalkoznak, egyszerű szabályalapú algoritmusok végzik a munkát. A második viszont „emberi szintű” mesterségesintelligencia-probléma.  

A kivitelezés azért lehetséges, mert az MI és a játékok is annyit fejlődtek, hogy egyesek szerint hamarosan eljön az idő, amikor a játéktervező művész néhány szkeccsel épp csak felvázolja az alapokat, az MI pedig kivitelezi az alkotó elképzeléseit, sőt, ma még ismeretlen, az emberi fantázia számára teljesen újfajta darabokat is létrehozhatnak.

Míg egyes területeken, például a jogban vagy az orvostudományban kifejezetten hátrány, ha az MI nem ismeri a múltat, előzményeket, addig a játéktervezésben a gép előnyére válhat, mert kihasználatlan kreatív potenciálokat szabadíthat fel.

Ráadásul még a fejlesztési költségeket is csökkenti.

DNS alapján azonosít személyeket a program

Különleges fejlesztéssel állt elő a Columbia Egyetem és a New Yorki Genom Központ (NYGC). A DNS-t használó szoftver személyek gyors és pontos azonosításában segít. A valósidőben 10-20 gigabájtnyi DNS feldolgozására képes hitelkártya-méretű MinION szkekvenáló eszközt és kereskedelmi forgalomban beszerezhető más technológiákat használnak hozzá. (A szekvenálás a DNS bázisainak sorrend-meghatározására használt biokémiai módszer.)

A kétlépéses folyamatban a kutatók a DNS-ből egyéni változatokat, egyedi nukleotidokat szedtek ki, majd valószínűségi algoritmussal vizsgáltak. Az összes apró változósort az adatbázisban található más genetikai profilok kapcsolódó változóival hasonlították össze. Minden egyes keresztreferenciával nő az azonosítás esélye, csökken a feldolgozandó anyag. A tesztekből kiderült, hogy a rendszer néhány perc alatt, 60-300 keresztreferencia után képes beazonosítani a kapcsolódást.

dna0.jpg

A kutatók által „MinION vázlatkészítésnek” nevezett technika agyunk azon képességéhez hasonlít, amellyel felismerhető képeket azonosítunk absztrakt mintázatokban. A tanulmány elsőszámú szerzője, a Cornell Tech posztdoktori hallgatója, Sophie Zaaijer szerint a technika olyan, mint amikor valaki pár jegy alapján ismer fel például egy Picasso-festményen látható madarat.

A technológia több fontos lehetséges alkalmazással kecsegtet.

dna.jpg

Az egyik áldozatok azonosítása katasztrófa sújtotta terepeken, például földrengés vagy repülőgép-szerencsétlenség után. Szakértők elmondása alapján a jelenlegi DNS-alapú megoldás tovább tart, mint a többi (fogak és más orvosi adatok vizsgálata stb.), ráadásul drága is. A MinION és az új szoftver az időt és a költségeket is csökkenti.

A rákkutatásban szintén használhatják. Sejtvonalak hibás azonosítása és fertőzéseik egy 2014-es tanulmány szerint kb. 9 milliárd dollár veszteséget generálnak megismételhetetlen vizsgálatok esetében. Az új technikával relatíve alacsony áron könnyebb az azonosítás, azaz a kutatásokra folyósított anyagi támogatásból kevesebb vész kárba, több pénz fordítható életmentő felfedezésekre. Neville Sanjana, az NYGC egyik vezető kutatója elmondta, hogy „jó áron az összes labor alkalmazni fogja a technikát.”

A GNU Általános Nyilvános Licenc alatt lévő szoftver máris letölthető a GitHubról.

Dél-Korea mesterséges intelligenciával mentené meg az újságírást

Dél-Koreában 383 napilap jelenik meg, 15 tévécsatorna, száznál több kábeltelevízió, és kb. 6600 internetes híroldal üzemel.

A Koreai Sajtóalapítvány (KPF) 2016-ban a sajtó iránti bizalom visszaszerzésén munkálkodó 15 tagú bizottságot hozott létre újságírókból, tanárokból, informatikusokból és nyelvfeldolgozás-szakértőkből.

A bizottság elnöke, egyben a Yonsei Egyetemen újságírást oktató Yoon Young Chul elmondta, hogy mesterséges intelligenciát, okos algoritmusokat is alkalmazva szeretnék a szakmát „visszatéríteni” a helyes pályára, azaz el akarják érni, hogy a nagyközönség jobban higgyen a cikkeknek, szerzőik pedig többet keressenek. Az új média annyira erodálta az újságírásba vetett bizalmat – így Yoon, hogy a szakmát egyre komolyabb erkölcsi és anyagi veszteségek érik. E célból fejlesztenek MI-rendszert, kategóriájában elsőt a világon.

delkorea1.jpg

„Új algoritmusok a hiteles újságírásért” – hirdette meg a programot Yoon egy novemberi konferencián Szöulban.

Ördögi körről beszélt: csökken a befogadók száma, összeomlik a hirdetésalapú üzleti modell, folyamatosak a dolgozói létszámcsökkentések, miközben egyre kevesebben, egyre rövidebb idő alatt termelnek egyre több hírt, történetet. Törvényszerűen romlik az anyagok minősége, csökken a hírmédiába vetett bizalom.

Yoon szerint azért kell algoritmusokat használni, mert algoritmikus döntések (szűrés, prioritások kiválasztása, képzettársítások) határozzák meg, hogy a fogyasztó hogyan látja a valóságot és milyen véleményt formál róla.

delkorea0.jpg

„Az algoritmusok sokszínűsége hat a hírek sokszínűségére” – állítja, és az óhajtott algoritmikus módszer alternatívát kínálna az „adjátok meg nekik azt, amit akarnak” logikán alapuló algoritmusokra.

A közbizalom visszanyeréséhez a médiaipar nagyobb mértékű szabályozását, az előfizetéses modellek erősítését, a saját kereskedelmi platformot üzemeltető portáloknak történő tartalomszolgáltatás leállítását javasolja.

David Levy, a Reuters Intézet igazgatója 36 országban végzett idei felmérésre hivatkozva közölte, hogy átlagban a felhasználók 13 százaléka fizet online hírekért: Hongkongban 21, Malajziában 20, Szingapúrban és az Egyesült Államokban 16, Ausztráliában 13, Dél-Koreában 12, Japánban 11, az Egyesült Királyságban 6 százalék.

„A számok egyrészt nem túl magasak, másrészt viszont az a gondolat sem teljesen igaz, hogy senki, de tényleg senki, a fiatalok pedig soha nem fizetnének hírekért. Több fiatal fizet értük, mint számítottunk rá” – értékelte az elemzést Levy, majd arra utalt, hogy talán azért van így, mert hozzászoktak, hogy más digitális termékek sincsenek ingyen.

A Netflixen megtekinthető filmeket és videókat, illetve a prémiumkategóriás Spotify zenéket hozta fel példaként.

Divatcézár mesterséges intelligenciák

Egyre több területen alkalmazzák valamilyen formában a mesterséges intelligenciát, így nem meglepő, hogy a ruhák, az öltözködés világában is megjelent, és a technológia akár új trend, az „előrejelző divat” kialakulásához vezethet.

A San Diegói Kalifornia Egyetem (UCSD) és az Adobe kutatói ugyanis kidolgozták, hogy az MI ne csak megtanulja az adott személy stílusát, hanem képeket is generáljon hozzá olyan ruhadarabokról, amelyeket feltételezhetően szeretne. A rendszerrel személyre szabott öltözékek készíthetők, sőt, idővel általánosabb divattrendeket is képes lehet előrejelezni.

fashion.jpg

Lényegében két algoritmusról van szó. Az első ideghálója megtanulja, hogy az illető mennyire kedvel bizonyos darabokat. Amazonos vásárlások alapján hat kategóriát vizsgál: női és férficipőket, felsőket, nadrágokat.

A második algoritmus az első által generált információn tanul. Egészen pontosam két idegháló, két „generatív ellenséges hálózat” (generative adversarial networks, GAN) használja az infókat; egyikük kamuképeket hoz létre, a másik ugyanazon adatok alapján dönti el, hogy melyik kép valódi, melyik nem. Az eredmény folyamatosan javul, a rendszer végül több képet javasol minden egyes felhasználónak.

fashion0.jpg

Az ajánlórendszerekhez hozzáadott GAN-ek segítik az eladót, hogy a vásárló milyen ruhadarabokat szeretne a már meglévőkön kívül. Persze ki kellene találni a 2D-s képek 3D-sekké alakításának módját is, de a kutatók egyelőre nem tartanak ott, azaz az ideghálók még nem helyettesítik a stylistokat. Például, ha valaki a kék inget szereti, a rendszer mai állapotában több kék inget generál neki, amit aligha nevezhetünk forradalminak. Jelen formájában arra sem képes, hogy például a cipőhöz passzoló nadrággal álljon elő.

Ennek ellenére a divat tökéletes terep a mesterséges intelligencia térhódítására: rengeteg az adat, hatalmas pénzekről van szó. Az Amazon be is kapcsolódott, az Alibaba pedig korábbi vásárlásokon alapuló ajánlórendszert fejlesztett a hangzatos „DivatMI” néven.

Costa Colbert, a kamu divatmodellek létrehozására alkalmas módszert nemrég bemutató Vue.ai divat MI startup főmérnöke szerint a UCSD és az Adobe kutatása ugyan figyelemreméltó, alkalmazásához viszont olyan őrült adatmennyiség kell, amelynek feldolgozását csak a legnagyobb kereskedőcégek engedhetik meg maguknak. Az ideghálók ma még inkább arra jók, hogy a felhasználónak megmutassák az összes rendelkezésre álló vásárlási opciót.

Robotasszisztens a Toyotától

Gyakran merül fel technológiai körökben, hogy merre vezet a távirányított, telejelenlét-vezérelt humanoid robotok jövője?

Humanoid robotok fejlesztésében köztudottan Japán jár az élen, így az sem meglepő, hogy legutoljára a szigetország egyik meghatározó fogyasztói elektronika és telekom óriása, a Toyota villantott fel valamit ebből a jövőből. A cég november 20-án mutatta le T-HR3 névre hallgató legújabb humanoid robotját, amely a sajtótájékoztató szerint „fejlődés az előző generáció hangszeren játszó gépéhez képest.”

toyota.jpg

A harmadik generációt jelentő T-HR3-at azért fejlesztették (a Toyota Partnerrobot Részlegén), hogy az ember biztonságát, „egyedi mobilitás-szükségleteit” segítse, legyen szó otthoni munkáról, veszélyes vagy távoli helyeken, sőt, akár a világűrben végzett tevékenységről.

A gép a Toyota „mestermanőverező rendszerét” használja, amellyel az ember távolról is képes vezérelni a robotot. A felhasználó által viselt, kapcsolódó exoskeletonon (robotikus vázon) lévő HTC Vive virtuálisvalóság-sisakkal az operátor teljes 3D-ben ugyanazt látja, amit T-HR3 lát. A robot 29 testrészét a páncéljába szerelt motoros fogaskerekek és érzékelők irányítják, lehetővé téve, hogy „gördülékeny és szinkronizált” legyen a humán operátorral való együttműködés.

toyota0.jpg

A Toyota nem az első cég, amely virtuálisvalóság-technológiát ágyaz az embert otthon és munkahelyen egyaránt támogató robotikus rendszerbe. A VR-eszközök egy ideje bőven túlmutatnak korai játékalkalmazásaikon, és értelemszerűen ugyan egyre több játékfejlesztő dolgozik VR-re, a technológia más területeken is megjelent, és lassan beszivárgott az iparba is.

A Ford autótervezésnél kezdte el használni a Microsoft egyszerre kiterjesztett és virtuális, azaz AR és VR, kevert valóság (mixed reality) HoloLens headsetjét. A Google-anyacég Alphabet újrakalibrálja, munkahelyi használatra dolgozza át a 2015-ben leállított – sikertelen – Glass Projektet, a cég kiterjesztettvalóság-szemüvegét.

A két kiragadott példánál természetesen hosszabb sort a Toyota folytatta, amely a napokban (november 29-től december 2-ig) zajló Nemzetközi Robotfesztivál 2017-en újabb bemutatót tart T-HR3-ról.