Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Jönnek az újgenerációs nyelvi modellek

2022. június 27. - ferenck

A világ különböző pontjain működő 132 intézet kutatói  új mércét dolgoztak ki nyelvi modellek teljesítményének megítélésére. Egyértelmű céljuk, hogy növeljék a rendszerek képességeit, mert olyan feladatokat kellene megoldaniuk, amelyekre a mai csúcsmodellek nem képesek. A benchmark neve is árulkodik: túl az Imitációs Játék mércén (rövidítve: BIG-bench).

Tíz kritérium alapján kétszáznál több feladatot választottak ki, például figyelmesnek kell lenni emberekkel. Atipikus problémákat szintén: találják ki egy sakkjátszma egyetlen, de sorsdöntő lépését, emojik alapján jöjjenek rá filmcímekre, képzeletbeli bírósági tárgyaláson játsszanak el egy szerepet. Ezek az internet memorizálásával sem oldhatók meg.

lmodel_1.jpg

A modell néhány példát kap kérdés-feleletpárokból, amelyek alapján új kérdésre kell válaszolnia. A kutatók teszteltek párat, de szigorúan csak tesztelték, és nem finomhangolták őket.  A feladatokat az OpenAI GPT-3-ján, a Google PaLM-ján és a szintén Google LaMDA-alapú BIG-G-jén, azok különböző méretű és kevésbé ismert változatain futtatták le. A nevek magukért beszélnek: valóban a mai csúcsmodelleket vizsgálták.

A feladatokat humán csapatnak is kiadták, ők használhatták hozzájuk a világhálót.

lmodel0_1.jpg

Függetlenül a mérettől, egyetlen modell egyetlen feladat megoldásában sem teljesített jobban, mint a legjobb eredményt elérő ember. A legjobbak azonban egyes feladatokban legyőzték a közepesen teljesítő embereket. A nagyobbak általában jobbnak bizonyultak a kisebbeknél, például a BIG-G pármillió paraméteres változata 33, a többmilliárdos 42 százalékot ért el.

A BIG-bench kitalálói szerint a mostani mércék szűk képességekre összpontosítanak. A legújabb nyelvi modellek viszont monumentális netes adatbázisokon történő előzetes gyakorlás után nem várt képességeket csillogtatnak.

A széleskörű új mércével viszont lehetővé válik e képességek kialakulásának, a modell, az adat és a gyakorlási módszer fejlődésének a megfigyelése.

Az internet megtanulása nélkül megoldandó feladatok kiadása új algoritmusok fejlesztésére ösztönözhet kutatóközösségeket. Ezek az algoritmusok komplexebb következtetési formákra lehetnek képesek, és így közelebb kerülünk az általános mesterséges intelligenciához (AGN, Artificial General Intelligence).

Mikor tudatos egy mesterséges intelligencia?

Az utóbbi hetekben bejárta az a hír a világot, hogy egy Google-mérnök szerint a vállalat egyik nyelvi modellje öntudatra ébredt. Állítására többen reagáltak, a szakértők általában szkeptikusak.

Andrew Ng, a gépi tanulás egyik legelismertebb képviselője szintén az, legyen szó bármelyik mai mesterségesintelligencia-modellről. Figyelmeztet, hogy a széles körben terjedő szenzációhajhász beszámolók sokakat félrevezethetnek az MI-vel kapcsolatban.

Ugyanakkor egy nagyon érdekes kérdés feltevésére is ösztönöznek: hogyan fogjuk megtudni, ha egy mesterségesintelligencia-rendszer valóban öntudatra ébredt?

tudatossag_1.jpg

A gépi tudatosság inkább filozófiai, mint tudományos kérdés. Tudományos hipotézisek meghamisíthatók, manipulálhatók, cáfolhatók. Az MI-vel kapcsolatban általában olyan kérdéseket teszünk fel, hogy legyőzhet-e humán sakkbajnokot, pontosan fordít-e egyik nyelvről a másikra, biztonságosan vezeti-e az autót, vagy sikeresen átmegy-e a Turing-teszten.

Ezek a kérdések tesztelhetők.

Másrészt viszont, nincs egyértelmű tesztünk a gépi tudatosság megállapítására, hogy egy rendszer mikor érző és van tisztában belső állapotával, illetve külső környezetével, mikor intelligens úgy általában, azaz tud-e változatos területeken érvelni. Ezek a témák filozófiaiak, és nem tudományosak.

Ng további filozófiai kérdéseket tesz fel. Ugyan nincsenek módszereink a legtöbb számszerűsítésére, viszont mindenképpen fontosak, és az emberiséggel egyidősek: jó vagy rossz a Homo sapiens? Mi az élet értelme? Tudatos-e egy fa, egy rovar vagy egy hal?

Ugyanezen az alapon, a mesterséges intelligenciával kapcsolatban felmerülő kérdések közül sok szintén filozófiai: lehet-e egy MI érző vagy tudatos? Lehetnek-e érzelmei, lehet-e kreatív? Képes-e megérteni amit lát és olvas?

Ng széles körben elfogadott tesztek kidolgozására számít, viszont a tudatosság és az érzékelés helyes tesztelési módszerének kialakítását herkulesi feladatnak tartja. Ugyanakkor, ha valakiknek sikerül, elfelejthetjük folyamatos vitáink jelentős részét.

A kutató teljes mellbedobással támogatja az általános mesterséges intelligenciát (Artificial General Intelligence, AGI). Egy jövőbeli AGI-rendszer talán tudatos lesz, és érezni is fog. De az is lehet, hogy nem. Ng nem tudja.

Viszont, ha nem állítunk fel egyértelmű mércét az érzékelés és a tudatosság megállapítására, irdatlan nehéz dolgunk lesz eldönteni, hogy egy MI elérte-e ezt a szintet, vagy sem.

Virtuális zöld növények az urbánus pokolban

Legyen szó hegymászásról, vagy sétáról egy nagyvárosi parkban, a természetben tartózkodás mindig békével és relatív nyugalommal tölt el mindenkit. Egyszerűen jól érezzük magunkat ezekben a környezetekben.

Két francia egyetem három kutatója e közegek pszichológiai előnyeit vizsgálva jutott el addig, hogy zöld növényeket helyezett egy, egyébként lehangoló, reménytelen nagyvárosi tájképbe, és önkéntesek mentális állapotát vizsgálták közben: javítottak-e rajtik a növények, vagy sem.

vr0_1.jpg

A válasz nem meglepő módon igen.

„Az ember lélektanilag jobban alkalmazkodott ahhoz, hogy betonkörnyezet helyett zöld növények között éljen. Épített környezetbe viszont sajnos nem mindig ültethetünk természetes vegetációt” – írják a kutatók.

Egyes akadályok, például a rossz várostervezés, vagy az anyagi és más források hiánya gyakran ellehetetleníti a városok „zölddé” tételét. Ugyanakkor egyre több várostervező használ valódi zöld színfoltokat, hogy természetes környezetünket utánozza.

vr_1.jpg

A kutatók kamukörnyezetekről készítettek képeket, amelyeken hidak, felüljárók és a városi infrastruktúra más elemei láthatók változó mennyiségű növénnyel, fákkal, kisebb-nagyobb lombkoronákkal.

A képeket összehasonlítva, a résztvevőkben olyan érzés támadt, mint amikor egy ragadozó állat ijesztő, de izgalmas új területre téved. Könnyebb belőlük megérteni, hogy a zöldebb közegek kellemesebb érzéseket, élményeket keltenek bennünk.

Virtuális valóságban – betondzsungel és zöld környezet keverékében –, HTC Vive headsettel a fejükön, a résztvevők lassabban járkáltak, magasabban tartották a fejüket és gyorsabban vert a szívük is, mint amikor csak szimpla betonközegben voltak a VR-ban.

Az összes teszt azt támasztotta alá, hogy a színek, különösen a természetet idéző zöld az öröm és az éberség kiváltásának hatékony eszközei az egyébként betonszürke urbánus tájban.

Az eredmények persze egyáltalán nem meglepők, mert mindannyian tudjuk, hogy a természet mennyire pozitív hatással van ránk.

Optimalizálás, másként

A repülőgépet, vízvezetéket és vízzel, levegővel interakcióba lépő más tárgyakat tervező mérnökök numerikus szimulációkkal tesztelik a lehetséges formákat, terveik javításához viszont a nem mindig megbízható próba-hiba módszert használják.

Neurális (idegháló-alapú) szimulátor azonban magát a formát is optimalizálhatja.

A Google-hoz tartozó londoni DeepMind kutatói „differenciált tanult szimulátorokat”, fizikai folyamatok szimulálását megtanuló ideghálókat fejlesztettek, hogy segítsenek a folyadékokat speciális módon „becsatornázó” felületek tervezésében.

neural_simulator.jpg

Bizonyos fizikai tulajdonságokkal rendelkező tárgyak tervezésének népszerű módja a numerikus szimulátorok használata: tervek versenyeztetése, tulajdonságaik tesztelése, a legjobb megtartása, véletlenszerű megváltoztatása, aztán jöhetnek az újabb változtatások.

A DeepMind megoldása gyorsabb és nem véletlenszerű, nincs benne esetlegesség: megadott paraméterekkel két- vagy háromdimenziós hálóként határozzuk meg a tárgy formáját, és egy megkülönböztető modell kiszámolja, hogyan változzon meg a legjobb teljesítményhez. Az információk alapján a forma tökéletesíthető.

A víz és a levegő részecske-rendszerekként modellálható. A kutatók gráfszerű ideghálókat gyakoroltattak, hogy reprodukálják egy előre elkészített szimulátor outputjait. A hálókat a részecskék különféle formák körüli áramlásának a szimulálására tanították be. A megelőző állapot alapján kellett a következőt előrejelezniük. Csomópontjaik részecskéket jelenítettek meg, a részecskéket az éleik kötötték össze.

Az ideghálók jobban teljesítettek, mint az előzetesen elkészített szimulátor. Hármat treníroztak, az egyik két-, a másik háromdimenziós vízi, a harmadik aerodinamikai közegben mérettetett meg.

Ideghálók számításintenzív fizikai szimulátor outputjának utánzására történő tanítása nem szokatlan, nem is új. Ugyanezeknek a hálóknak szimuláció futtatása helyett az inputnak a szimuláció outputjára „rímelő” optimalizálására való alkalmazása viszont az.

Etikai okokból állította le a fejlesztőcég egy fegyveres drón gyártását

Az Egyesült Államok közvéleményét megosztja az egyre jobban elharapózó fegyveres erőszak. A többség a fegyverbirtoklás szigorúbb szabályozását követeli, míg mások szerint a szigorítás sérti a még a 18. századi alkotmányban, teljesen más politikai és társadalmi viszonyokra megfogalmazott jogokat. Ők a fegyveres őrök számát, a veszélyeztetett intézmények fegyveres védelmét növelnék.

Az utóbbiak álláspontjára rímel a büntetés-végrehajtási eszközöket, például elektromos sokkolókat és testkamerákat készítő Axon legújabb fejlesztése, egy elektrosokkot okozó nyilak kilövésére képes, távirányított drón. A vezető nélküli légi jármű így hatástalanítaná az iskolák, vállalatok, áruházak és más nyilvános helyek körüli támadókat.

dron.jpg

A cég azonban leállította a drón értékesítési folyamatát. Az ok: főként független szakemberekből álló etikai bizottságának többsége lemondott, így tiltakozva a fegyverrel felszerelt légi jármű esetleges értékesítése ellen.

A gép a cég korábbi megfigyelő drónján, a kamerával és sokkolóval ellátott Axon Air-en alapul. Humán operátor dönti el, hogy az Air elektromosan sokkoló lövedéke mikor kapjon zöld fényt.

dron1.jpg

Rick Smith vezérigazgató szerint ötven-száz drón gyártása kb. ugyanannyiba kerülne, mint egy fegyveres biztonsági őr. Egy könyvében (The End of Killing) és egy regényében Smith kifejti, hogy a drón automatikusan lőne, miután mesterséges intelligenciával felszerelt mikrofonja lőfegyver hangját detektálta. A rendszer figyelmeztetné a helyszínen tartózkodó biztonságiakat, adminisztrátorokat és a rendőrséget.

Az Axon etikai bizottságának kilenc tagja a tervet ellenző nyilatkozatot tett közzé. Szerintük a drón nem tudná megakadályozni az elkövetők tömeges lövöldözését, az Egyesült Államok iskoláinak tragédiáit.

A gép megfigyelő kapacitását szintén kritizálták. Ártana a színesbőrű közösségeknek, és minden más, a rendőrség által jobban figyelt csoportnak – véli

Mennyire ébredt öntudatra a Google mesterséges intelligenciája?

Egy chatbot, a Google LaMDA modellje legalább egy személyt, a vállalat Felelős MI részlegén dolgozó kutatót, Blake Lemoine-t meggyőzött arról, hogy öntudatra ébredt.

A transzformer-alapú modellt 1,56 trillió, párbeszédben elhangzott szón treníroztak, majd azokat kellett reprodukálnia. A LaMDA családhoz tartozó MI-k 2 és 137 milliárd közötti paraméterrel dolgoznak. A Google szakemberei korábban arról tárgyaltak, hogy termékeikbe, például a keresőbe vagy az asszisztensbe integrálják őket.

Előzetes gyakorlás után, LaMDA sok lehetséges választ generált. A fejlesztők összegyűjtöttek egy sor beszélgetést a chatbottal, majd több személyt felvettek az MI kiértékelésére: mennyire érzékeny, speciális, érdekes és normális válaszokat ad.

googleai.jpg

Utána finomhangolták, hogy minden egyes választ követően ugyanazokat az értékeléseket generálja. A legmagasabb pontszámot érte el, de hogy tovább finomítsanak rajta, a miatta felvett dolgozók kereséseit kellett utánoznia, és ha úgy adódott, külső rendszeren nézelődött, anélkül, hogy válaszolt volna. A korábbi inputok és az új keresési eredmények alapján új outputot generált, ami új válasz vagy további keresés lehet.

A Felelős MI csoport kutatói a gyűlöletbeszéd és más káros viselkedési formák miatt tesztelték a LaMDA-alapú chatbotokat. Lemoine eközben győződött meg az MI öntudatáról, hogy érzékeli saját személyiségét.

google_ai0_2.jpg

A kutató a Google-dolgozók és a modell közötti kilenc beszélgetésről készített átiratot (az ábrákon ezekből a beszélgetésekből láthatunk részleteket), majd közölte: LaMDA tudatos. Az egyik átiratban az MI kijelentette: véleménye szerint ő egy személy, jogai vannak, és fél, hogy kikapcsolják.

A vállalat a titoktartás megszegése miatt június elején szabadságolta Lemoine-t. A kutató ugyanis ügyvédet fogadott, hogy védje meg LaMDA létezéshez való jogát, és az USA képviselőházának egyik tagjával is beszélt arról, hogy a Google mely ponton sértette meg LaMDA kapcsán az etikai alapelveket. Ezt követően közölték vele, hogy nincs bizonyíték az MI tudatosságára.

Lemoine egy blogposztban leírta: a vállalat nem bánik korrekt módon az etikai kérdéseket feszegető dolgozóival.

Az MI-fejlesztő közösség több tagja szkeptikus a kutató véleményével kapcsolatban. Az ember mindent, még a legkisebb jeleket is antropomorfizálni szeretné, és a Google mérnökei sem mentesek ettől a vágytól – állítja Melanie Mitchell, a Santa Fe Egyetem tanára.

A gépek antropomorfizálási hajlama az úgynevezett Eliza effektus az 1960-as évek közepének legendás chatbotjára utal, többen hitték róla, hogy ember, humán pszichoterapeuta. A teremtményeinkhez fűződő érzelmi kötődés kb. a Homo sapiensszel egyidős, Pygmalion, a képzeletbeli ógörög szobrász is beleszeretett saját alkotásába. Intő példa, és józan ítélőképességünket gépeinkkel kapcsolatban is meg kellene őriznünk.

Andrew Ng gépitanulás-szakértő szerint nincs okunk feltételezni, hogy a Google MI-je öntudatra ébredt volna. A tudomány és a technológia jelenlegi állása mellett, minden ilyen állításhoz kellő szkepticizmussal kell viszonyulnunk – jelentette ki.

Kvantumszámítógép tankban?

Az Egyesült Királyság Védelmi Minisztériuma azzal a céllal vásárolt egy kvantumszámítógépet, hogy tanulmányozzák: a technológia „intelligenssé” tehet-e egy tankot, azaz jöhetnek-e hamarosan az „okos tankok”?

Richard Murray, a kvantumszámításokkal foglalkozó Orca vezérigazgatója múlt héten jelentette be az üzletet. A minisztérium azért figyelt fel a gépükre, mert egyes termékeik beférnek szabvány számítógépházakba, és szobahőmérsékleten is működnek.

okos_tank.jpg

„Alkalmas ezekre, és hosszú ideig működőképes. Egyszer talán vadászgépben is lehet. Leginkább azonban nagyobb méretű, a földfelszínen működő platformra összpontosítunk” – nyilatkozta Murray.

Akad azonban egy komoly probléma: nem teljesen világos, hogy egy kvantumszámítógépnek mit kell tennie, mit tud tenni bármilyen katonai felszerelés részeként. Másrészt, az ezirányú kutatásokkal és fejlesztésekkel foglalkozó tudósoknak be kell bizonyítaniuk, tényleg van-e a technológiának úttörő, alkalmazása a való világban, sőt, lesznek-e egyáltalán ilyen alkalmazások.

okos_tank0.jpg

A szóban forgó gép (amit a hadseregnek leszállítanak) semmi olyat nem csinál, amit egy klasszikus komputer nem tesz meg. Murray szerint inkább kutatási eszközről van szó. Ráadásul a brit hadsereg sok technológiai tevékenységet finanszíroz.

Kvantumszámítógépek eddig nagyon speciális matematikai problémákra igyekeztek választ adni. Eleve felgyorsítják az ilyen típusú problémamegoldást. Az viszont végképp nem világos, hogy ezek az adottságok hogyan alkalmazhatók katonai környezetben.

Az Orca azt szeretné, ha technológiájukkal könnyebb lenne a harctéri kommunikáció, leegyszerűsödne a képfelismerés és a szenzorok kezelése. Hatékonyabb és gyorsabb lehet a döntéshozáshoz nélkülözhetetlen információfeldolgozás, csökkennének a csatatéren kívül elhelyezett, az események helyszínén nem telepíthető processzorokkal történő adatmegosztásból eredő kockázatok.

Egyelőre viszont fogalmunk sincs, hogy kvantumszámítógéppel tényleg okosabbak lesznek-e a brit tankok.

Mindenki mást lát a Delta új reptéri kijelzőjén

Reptereken járva manapság – a biztonság ürügyén – személyiségi jogainkból sajnos fel kell adnunk valamit, az egy ideje a biometrikus megoldások felé keményen hajló amerikai légitársaság, a Delta Air Lines pedig minimum 2017 óta foglalkozik arcfelismeréssel – Minneapolis repterén akkor indítottak arcfelismerő pilotprogramot, ami opcionálisan lehetővé tette egy speciális kioszk használatát. Arcfelismerés és személyi/útlevél-ellenőrzés után az utas gyorsan becsekkolhatott, nem kellett hosszas sorokat végigállnia.

A Delta most továbblép.

A hatalmas reptéri információkijelzőkön sokszor igencsak nehéz megtalálni, amit keresünk – járatunk pontos adatait –, mert annyira túlzsúfolt a képernyő. A Detroiton keresztül utazó Delta-utasoknak sokkal könnyebb dolguk lesz, mert a hamarosan installálásra kerülő új kijelző személyre szabott infókat fog szolgáltatni. Egyszerre maximum százan nézhetik majd.

delta.jpg

A Misapplied Sciences cég fejlesztésének bétaváltozata június 29-től áll a Detroit Metropolitan Airport Delta utasai rendelkezésére. Míg a legtöbb kijelző-fejlesztő arra büszke, hogy szinte bármilyen szögből láthatjuk az infókat, addig az újonnan kidolgozott Parallel Reality technológia a látószög függvényében személyre is szabja a látványt.

A cég nem árul el minden részletet, az viszont kiderült, hogy a szoftveresen kontrollált pixeleket használva, a kijelző különböző színekben és megvilágításban akár többmillió fénysugarat vetíthet felénk egyszerre. Speciális irányokba terjednek, és a masszív feldolgozó-kapacitásnak köszönhetően, száz nézőt is „célba vehetnek”, követhetnek szimultán.

Az eredmény: ahelyett, hogy perceket töltenénk, míg megtaláljuk, melyik kapuhoz kell mennünk, akkor is csak a saját járatunkra vonatkozó infókat látjuk, ha egyszerre sok járatot jelenít meg a kijelző.

Mielőtt személyiségi jogainkat – joggal – féltenénk, a fejlesztők és a Delta megígérte, hogy az adott infót csak mi látjuk, senki más. Az arcfelismerés a megoldás nyitja.

A Delta megerősítette: az arcszkeneket Minneapolisban sem tárolták, és a detroiti reptérre is érvényes ugyanez. A kijelző-használat is opcionális, csak a belépőkártyánk leszkennelése és a képernyőbe nézés után jelennek meg a járatunkra vonatkozó, tehát személyes adatok.

Ha viszont használtuk már a Delta digitálisidentitás-szolgáltatását, az azonosítás automatikus, és még gyorsabb az egész. Kérdés persze, hogy adattárolás nélkül, ez hogyan valósítható meg?

A rendszer kétségtelen előrelépés, de akármennyire is tiltakozik a Delta, sajnos a megfigyelés magasabb szintjei felé is az.

Graffitit fest a robot

A Georgia Tech robotika PhD-hallgatói által fejlesztett GTGraffiti azt teszi, ami a nevében van: graffitikat fest. A világ első graffitifestő robotrendszere mozgásmegragadás (motion capture) technológiával rögzíti az ember festés közbeni mozdulatait, majd létrehozza és feldolgozza azokat a mozgásokat, amelyek alapján a kábeleken vezérelt gép falra fújja az alkotást.

A rendszer működése három elemen alapul: műalkotás kivitelezése, hardver, tervezés/irányítás.

georgiatech_robot0_1.jpg

A humán művész mozgásának rögzítésénél derül ki, milyen mozdulatokra van szükség egy graffiti megvalósításához. Két festő az ábécét fújta a falra, a rendszer mindkettejük és a spray mozgását is követte.

Az adatokból kinyert infókat felhasználták a robot építéséhez, azok alapján döntöttek a kábelvezérelt megoldás mellett. Egy ilyen gép kábeleken, motorokkal, szíjtárcsákkal működik. Kb. háromméteres keretre tették, de lényegében bármilyen lapos felületen elhelyezhető.

georgiatech_robot.jpg

A harmadik fázishoz a műalkotást elektronikus jelekké alakították. A digitális karakterek bármilyen méretben, perspektívában, kombinációban programozhatók. A könyvtárból humán művész válogat, és készíti el az alkotást, ami ezúttal három betű kombinációja, az ATL volt.

A karakter-szekvencia és a pozíció meghatározása után a kutatók matematikai egyenletekkel dolgozták ki a robot számára követendő „útvonalakat.” Ezek garantálják a pontos tempót, elhelyezkedést, irányultságot és perspektívát. Végül az útvonalakat motorikus utasításokká alakították, kivitelezték.

A gépet úgy fejlesztették, hogy a motorok ne hatástalanítsák egymást, azaz biztonságosan működjön. A végeredmény: GTGraffiti az adott humán graffiti-művész stílusában tud festeni.

A kutatók azért választották a művészetet, mert a festészet és a tánc a legkomplexebb és legárnyaltabb mozdulatokat képes kihozni belőlünk, és ha magas szintű tevékenységre képes robotban gondolkozunk, adják magukat ezek a lehetőségek. A gép különleges dolgokra lesz képes, az embernek is többet segíthet, a graffiti pedig a képzőművészet legszélesebb rétegekhez eljutó formáinak egyike.

Jelenleg előre felvett formákkal, különféle méretekben kísérleteznek. Tesztelik, hogy a robot elboldogul-e nagyobb felületekkel. Ha igen, akkor művészek által nehezen, vagy egyáltalán nem megközelíthető helyeken is működhet. Az is elképzelhető, hogy a művész a világ egyik pontján, GTGraffiti egy másikon festi ugyanazt a falra.

A gép nem generál műalkotást, hanem együttműködik az alkotóval, hogy ketten együtt többet hozzanak ki az alapötletből, mintha a művész egyedül lenne. Létrejöhet a valósidejű robot-művész interakció.

Képalkotó sejtautomata

A mélytanulás (deep learning) többféle neurális-alapú képgenerátort kínál: generatív ellenséges hálózatokat (GAN), diffúziós modelleket, önkódoló rendszereket stb. Mindegyiknek vannak előnyei és hátrányai, együtt viszont csábító lehetőségeket kínálnak adatszintézishez, vizuális műalkotáshoz.

A sejtautomataként ismert számítási rendszerek biológiai sejtek viselkedését nagy vonalakban utánzó egyszerű szabályok iteratív alkalmazásával képesek pixelek mintázatait reprodukálni. A Koppenhágai IT Egyetem kutatói tovább mentek egy lépéssel: automatájuk nemcsak reprodukál képeket, hanem újakat is tud generálni.

sejtautomata.jpg

Úgynevezett variációs önkódolót (VAE) kombináltak egybe a neurális sejtautomatával, és a rendszer, a variációs neurális sejtautomata (VNCA) az idegháló kimeneteire és a szomszédos pixelek állapotára alapozva, frissíti a pixeleket (lásd az első és a második, illetve a harmadik és a negyedik ábra közötti különbségeket)..

sejtautomata0.jpg

VAE kódoló és dekódoló összjátékának eredményeként generál adatokat. Bármely architektúra lehet dekódoló mindaddig, amíg az inputhoz hasonló adatokat rekonstruál. A neurális sejtautomata a VAE mintázatait használva hoz létre új, előzetesen nem feltétlenül meghatározható adatokat – például képeket.

A VNCA vektorok rácshálózatának frissítésével generál pixeleket. Minden egyes vektor egy sejt, és minden egyes sejt egy pixelnek felel meg. A kódoló egy idegháló, amely a szomszédos vektorok állapotának függvényében frissít vektorokat.

sejtautomata1.jpg

A kutatók kézzel írt számjegyeket tartalmazó adatbázis képeinek rekonstruálására tanították meg a rendszert, és az automata valóban létrehozott – nem jó minőségű – új képeket.

sejtautomata2.jpg

A VAE és neurális sejtautomaták kombinációja hasznos alkalmazásokhoz vezethet. Például eltorzítanak képeket, majd kijavítják a sérült pixeleket, és így képfestésnél is jól működhetnek.

Skálázásukkal azonban vannak még problémák: a VNCA dekódere mindössze 1,2 millió paraméterrel dolgozott a csúcskategóriás dekódereknél megszokott többszáz-millió helyett. Paraméterek hozzáadásával viszont jelentősen nőnek a számítási költségek.

A koppenhágai kutatás ezzel együtt izgalmas, viszont korai még bármiféle messzemenő következtetést levonni belőle.

süti beállítások módosítása