Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

„Interaktív vásznak” mesterséges intelligenciával

2023. október 12. - ferenck

A generatív művészek kódban dolgoznak. Processing-típusú programozási nyelveket vagy szövegből képet készítő MI-eszközöket használva, az expresszív szemantikát színes mintázatokra vagy szürrealisztikus tájakat alkotó kódsorokká fordítják le.

A kódolás művészete azonban időigényes, bonyolult folyamat. A javítás iteratív, próba-hiba jellegű, gyakran dühítően átláthatatlan interfészekkel. Digitális művészekkel kreatív frusztrációikról készített interjúk után, a Stanford Egyetem kutatói az ötletelési és az editálási folyamatot javító eszközzel álltak elő.

interaktiv_vasznak.jpg

A művészi fantázia számítógépes kódra fordítása időigényes és nehéz folyamat. Egy nagy nyelvmodell jó kiindulási pont lehet (ezúttal a GPT-4 volt az alap), viszont ha a művész különböző textúrákat, színeket vagy mintázatokat akar felfedezni, még jobban megismerni, kifinomultabb kontrollra vágyik, a modellek azonban nem rendelkeznek ilyennel, nem tudnak segíteni. Az új eszköz neve nem véletlenül Spellburst, azaz varázslat, mert tényleg segít az alkotónak a szemantikus tér és a kód közötti zökkenőmentes váltásban.

Inputként megadjuk a kezdő promptot, például: „gyönyörű fényes rózsacsokor üvegképe.” A modell erre legenerálja a kódot, hogy megjelenítse a szöveget. De mi van, ha a virágok túl rózsaszínűek, vagy az üveg nem stimmel?

interaktiv_vasznak0.jpg

A művész ilyenkor megnyithat egy, az előző promptot használva létrehozott, dinamikus elemeket tartalmazó panelt. Ezekkel változtathat a képen, vagy módosít a szövegen, például sötétkék rózsákat ad meg. Különféle változatokat, például a negyedik csokorját a kilencedik vázájával keverheti össze, promptalapú felfedezésről programszerkesztésre válthat. A képre kattintva, látja a kódot, ami részletesebb finomhangolást tesz lehetővé.

A Spellburst fejlesztése előtt tíz kreatív kódolót kérdeztek meg ötleteik kidolgozásáról, munkafolyamatokról, legnagyobb kihívásokról, a tesztelést pedig generatív művészekkel végeztették el. A visszajelzések egyértelműen pozitívok voltak.

Az eszköz persze nem hibátlan. Egyes promptoknál meghökkentő az output, a változatok időnként furcsán keverednek össze, de a Spellburst mindezek ellenére ígéretes, hamarosan nyílt forráskódúvá fogják is tenni.

  

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr3218224631
süti beállítások módosítása