Gépi művészet, átírt szabályokkal

2020. szeptember 03. - ferenck

A lovak általában nem hordanak kalapot, mint ahogy a generatív ellenséges hálózatok (GAN) sem a programozók utasításait követik. Egy új MIT-s (Massachusetts Institute of Technology) megoldással (GANPaint) viszont bele is nyúlhatunk egy ilyen hálózatba, és kalapot is tehetünk a lóra.

Ideghálók mélyrétegeinek szerkesztésével soha nem látott meghökkentő képek generálhatók.

„Mindegyik GAN komoly művész, viszont csak azt tudják utánozni, amit látnak. Ha közvetlenül átírjuk a szabályaikat, csak az emberi fantázia lesz a határ” – nyilatkozta David Bau, az egyik fejlesztő.

Egy GAN két „ellenséges” ideghálóból áll, együtt próbálnak élethű képeket, hangokat stb. létrehozni. Az egyik, a generátor, megtanulja utánozni a képen látott arcot. A másik, a megkülönböztető, összehasonlítja az újat az eredetivel, majd visszajelez, és az iterációk a hiteles végeredményig folytatódnak.

Döbbenetesen élethű, de teljesen bizarr munkákat is generálnak, minden a megtanult adatsortól függ. Minél több a példa, annál jobb az output.

A kutatók viszont kimutatták, hogy nincs szükség óriási adatsorokra. Ha megértjük a modell „huzalozását”, a rétegeiben lévő számszerűsített súlyok céljaink szerint szerkeszthetők, így pedig megcsinálhatjuk saját magunk adatsorát. Úgy változtatjuk meg a feltételeket, hogy a modell például kalapos lóval álljon elő.

„Mintha egy szentjánosbogár DNS-ét tennénk egy növénybe, hogy világítson a sötétben” – magyarázza Bau.

A GANPaint programmal az idegháló speciális célokat szolgáló mesterséges idegsejtjei ki- és bekapcsolhatók, azaz funkciók tüntethetők el, vagy adhatók hozzá, memóriabankjai pedig átírhatók. Az egyik képből kimásolunk egy fát, majd egy épület tetejére illesztjük. Ezt követően a modell csomó hasonlóval áll elő.

A kutatók szerint az idegháló minden egyes rétege asszociatív memóriaként működik, és ha elég képet táplálunk beléjük például kapukról, megtanulják a funkcióikat. A szabálysorokat memorizálva, jobban értik a világot.

Egy GAN szerkesztésének azonban megvannak a maga korlátai. Az összes, tárgyakhoz, állatokhoz stb. kapcsolódó idegsejt azonosítása nagyon nehéz, ráadásul egyes szabályok megváltoztathatatlanok, hiába próbálkoztak velük, nem sikerült.

A számítógépes grafikában máris alkalmazzák a GANPaint-et, de ritka jegyeket felismerő mesterségesintelligencia-rendszereknél szintén számítanak rá. Segít megérteni, hogy egy GAN hogyan tanul meg vizuális fogalmakat.