Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Élethű képeket generál a Microsoft mesterséges intelligenciája

2018. január 25. - ferenck

A mesterséges intelligencia remekül utánozza az emberi hangot, meg sem lehet különböztetni egyiket a másiktól. A Google AutoML rendszere MI-ket hoz létre, és egyikük jobban teljesített képkategorizálásban, tárgydetektálásban, mint az ember által fejlesztett gépilátás-rendszerek. Más területeken szintén döbbenetes az MI fejlődése.

A rajzolásban, képalkotásban, általában a kreatív, művészi tevékenységekben viszont gyengébben teljesítenek a gépek, pedig már régóta próbálkoznak az alkotással. A Google például SketchTNN programjával megtanított firkálgatni egy MI-t, speciális vagy bonyolultabb képek viszont meghaladják jelenlegi képességeiket. Létező képek újraalkotásában, átértelmezésében már elég jók, de azért az ottani eredmények sem teljesen meggyőzők (Google Deep Dream stb.)

microsoft0.jpg

A Microsoft is kísérletezik ezen a területen, a vállalat MI képgenerátorát úgy programozták, hogy szöveges leírások alapján hozzon létre képeket.

Komoly kihívás, hiszen bizonyos kritériumoknak megfelelő képeket találni az interneten sokkal könnyebb és távolról sem akkora próbatétel, mint alkotni egyet. Az AttnGAN (Attentional Generative Adversarial Network) ideghálót kép-felirat párokkal gyakoroltatták, meg kellett tanulnia, hogy melyik szavak melyik képekhez kapcsolódnak.

microsoft.jpg

A kutatók a napokban számoltak be arról, hogy az MI automatikusan kiválasztja a kép különféle részeihez társítható szavakat, amelyek alapján aztán képrészleteket generál. Például inputként megkapta az „ennek a kismadárnak sárga hasa és feje, fekete szárnya, csőre és szeme van” szöveget, amire döbbenetesen passzoló képet generált. 

Ehhez hasonlót még senki nem ért el.

„Ha a Bingen madarat keresünk, kapunk egy madarat ábrázoló képet. Itt viszont a számítógép pixelről pixelre hozta létre a semmiből a képet” – magyarázza a kutatást vezető Xiaodong He.

Állítása szerint a technológia kb. háromszor jobb a korábbi képgenerátoroknál. Sokat segíthet fotósoknak képszerkesztésben, festőknek szkeccsekkel. He az írott szkriptből generált animációs filmekben is komoly alkalmazási lehetőséget lát.

Egyértelmű, hogy a vezető techcégek, például a Google és a Microsoft is a gépi tanulás határait feszegetve, folyamatosan kitolva próbálják uralni a mesterségesintelligencia-kutatást. Gépi képalkotásban most a redmondi óriás áll nyerésre.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr3413597295

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.