Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Egyre jobbak a mesterséges intelligenciák a képalkotásban

2022. szeptember 23. - ferenck

A szöveges utasítások alapján képet generáló algoritmusok, és általánosságban a képtechnológia az utóbbi évek mesterségesintelligencia-fejlesztéseinek egyik legígéretesebb ága. Az idei év áttörés, mert MI-ket ugyan tavaly és tavalyelőtt is használtak képalkotásra, viszont nagyon kevesen férhettek hozzájuk. 2022 második felében jutottunk el addig, hogy egyes algoritmusokat jóval többen, szélesebb körben, ingyen alkalmazhatunk.

A gépi tanulás egyik legavatottabb szakértője, az amerikai-kínai Andrew Ng a Müncheni Műszaki Egyetemen fejlesztett Stable Diffusion-ben látja a fordulópontot, és egyben mérföldkövet is az MI történetében. A modell ingyen letölthető, szabadon futtatható a felhasználó hardverén. Ironikus módon sokkal közelebb áll a nyílt MI-hez, mint a magát nyílt MI-nek nevező kaliforniai OpenAI DALL-E rendszere (vagy a Google hasonló megoldásai).

image_generators2.jpg

Az MI-vel történő képgenerálás ugyan még nem kiforrott technológia, de máris nagy durranás. Sok kreatív személy rendelkezik művészi tehetséggel, viszont pocsékul rajzol. Ng magáról is beszél, bár amatőr illusztrátori munkája kimerül a lányának készített rajzokban (az első kép bal oldalán Ng, jobb oldalán a Stable Diffusion a kutató iránymutatása alapján készült pandája).

Valódi művészek számára a képgenerátorok óriási segítséget jelentenek, fantáziájukat jobban kiélhetik velük. Így készült alkotás már meg is nyert egy művészi versenyt a Colorado Állami Képvásáron.

image_generators1.jpg

A nagyteljesítményű okostelefon-kamerák robbantottak a fényképezésben, és ma már kevés fotóhoz kell igazi professzionális gép. Ng hasonlót vár az MI képgenerátoroktól a képzőművészetben: az egyre jobb modellekkel és felhasználói interfészekkel – MI-vel – eredményesebben teremthető művészi érték, mint nélkülük. A jövőben több műalkotás születik mesterséges intelligencia közreműködésével, mint nélküle, és végre a rosszul rajzoló, de nagyon kreatív alkotók is értékes munkákkal állhatnak elő.

image_generators.jpg

Ng egyik kollégája az MI helyettesítheti-e a radiológusokat kérdésre azt válaszolta, hogy az MI-t használó radiológusok fogják helyettesíteni az MI-t nem használó kollégáikat. A képzőművészetben hasonló tendencia érvényesülhet. A múltban is mindig az új technológiákat alkalmazó alkotók értek el nagyobb sikereket.

image_generators0.jpg

Az emberi fogyasztásra generált képek, fotorealista ábrázolások (lásd Obama elnök Stable Diffusion-nel készített portréja) mellett az algoritmusok gépi fogyasztásra szintén készítenek vizuális anyagokat. Több cég például gépilátás-algoritmusok betaníttatásához szükséges gyakorlóképek készítésére fejleszt technikákat. Ng szerint ezekkel az algoritmusokkal jelentősen csökkenhetnek az adatgenerálás és gépek közötti (machine-to-machine) más folyamatok költségei is.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr2017936242
süti beállítások módosítása