Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Robot-világcsúcs száz méteres futásban

2022. október 06. - ferenck

Az Oregoni Állami Egyetem Agility Robotics cége által fejlesztett Cassie nevű kétlábú robot történelmet írt: kétlábú robotok közül eddig ő futotta le leggyorsabban a száz métert, ami hivatalos Guinness Világcsúcs.

Összehasonlításként, a férfi száz méteren Usain Bolt a csúcstartó 9,58 másodperccel, azaz Cassie 24,73 másodperce valóban figyelemre méltó eredmény. De más szempontból is az, mert ő az első, mozdulatait gépi tanulás segítségével külső térben irányító robot.

Az eseménynek a felsőoktatási intézmény atlétikai központja adott otthont. Cassie álló helyzetben kezdte, majd sprintre váltott. Lábait úgy hajlította, mozgatta, mint egy strucc. Nincs kamerája, és külső szenzorokat sem használ, azaz vakon futott.

cassie.jpg

Korábban egyszer már lefutott öt kilométert. A távot 53 perc alatt tette meg, egyetlen elemtöltés elégnek bizonyult hozzá.

A fejlesztést vezető Jonathan Hurst elárulta, hogy a gépen hét évig dolgoztak, és futás mellett lépcsőkön is fel- és lefelé közlekedik.

„A gépi tanulást régóta használják mintafelismerésre, például képfelismerésre, robotok viselkedésének irányítására viszont még nem. Ez teljesen új és más” – magyarázza Devin Crowley. a fejlesztésben részt vett PhD-hallgató.

Cassie a helyváltoztatást célzó robottanulás úttörő kutatásának platformja. Míg az öt kilométer teljesítése a megbízhatóságról és a kitartásról szólt, addig a száz méter a robot gyorsaságáról.

A kutatók az öt kilométer megtétele után váltottak, és a sebességre kezdtek összpontosítani.

Sprintben Cassie világelső, viszont nem ő az egyetlen kétlábú robotsprinter. A Boston Dynamics és a Mabel korábban fejlesztett már sprintergépet, őt tartják a világ leggyorsabb, térddel rendelkező robotjának.

Cassie viszont az első, de nem az utolsó, amely tényleg megtanult futni. Az Oregoni Állami Egyetem kutatói szerint irányítás-megközelítésük fontos szerephez jut a jövő robotikájában. Száz méteren ez a módszer tűnik a leghatékonyabbnak, és nyilvánvalóan Cassie világcsúcsa sem tart örökké.

Bitcoin-bányászat 2009-2022: 200 millió tonna széndioxid kibocsátása

A nyílt forrású digitális fizetőeszköz bitcoint, az első kriptovalutát a titokzatos – ismeretlen – Satoshi Nakamoto bocsátotta ki a 2008-as amerikai bankválság kirobbanása után, 2009. január 3-án.

A központi kibocsátótól és hatóságoktól, semmiféle harmadik féltől nem függő, peer-to-peer hálózat csomópontjain tárolt, elosztott adatbázisra alapuló fizetőeszköz forradalmasította a pénzügyi technológiákat. Mivel biztonságos és anonim, és a rendszer decentralizált, hamar népszerűvé vált. Árfolyama változó, 2021. november elején közel 65 ezer dollárt ért, az utóbbi hónapokban viszont folyamatosan csökkent az értéke, most majdnem 20 ezer dollár.

bitcoin_1.jpg

Sokak szerint a jövő pénze, mások piramisjátéknak tartják, egy viszont biztos: „bányászata” rendkívül energiaigényes. 2018-ban magasabb volt a közel 50 milliós Kolumbia éves energiafogyasztásánál, 2020-ban pedig meghaladta Ausztriáét, Belgiumét és a 200 milliós Pakisztánét is. A kriptovalutára fordított irdatlan számítási kapacitások a jövőben csak nőni fognak, ami teljesen szembemegy a jelen környezetvédő és a klímakatasztrófát elhárítani hivatott törekvéseivel.

Az angol Cambridge Egyetem kutatóinak számítása alapján, a digitális pénz kibocsátása óta, azaz tizenhárom év alatt a bitcoin-bányászok miatt közel 200 millió tonna széndioxid került az atmoszférába.

bitcoin0_2.jpg

A Cambridge Bitcoin Kriptovaluta Index (CBECI) minden egyes országra kiszámítja a bányászat mértékét. Az adatok alapján készült modell a bányászó hardverek energiafogyasztását és teljesítményét, a bitcoin aktuális árfolyamát, valamint azt a pontot jeleníti meg, amikor változatos szituációkban különböző eszközök működtetése profitot kezd generálni.

A pontos szám (szeptember végéig) 199,65 millió tonna széndioxid, és külön aggodalomra ad okot, hogy a kibocsátás 92 százaléka az elmúlt négy esztendőben történt.

Szerencsére sok kriptovaluta lényegesen környezetbarátabb, vagy szinte teljesen zöld. Az iparág célkitűzése, hogy 2030-ra száz százalékkal csökkentsék az általuk generált széndioxid-kibocsátást.

Szövegből videót alkotó mesterséges intelligenciát fejlesztette a Meta

A Meta (azaz a Facebook) bemutatta Make-A-Video („Csinálj videót”) nevű, rövid szöveges utasítások (promptok) alapján rövid videókat generáló mesterségesintelligencia-rendszerét. Begépeljük például, hogy „szuperhős- ruhába, vörös köpenybe öltözött kutya átrepül az égen” mondatot, mire az MI öt másodperces, a szöveget élethűen visszaadó, pszichedelikus home movie-kat idéző videóval áll elő.

A videók egyelőre elég nyersek, viszont látható belőlük, mi az idei évet meghatározó, szövegből képet létrehozó fejlesztések következő lépése – állóképek után itt vannak már a mozgóképek is.

A Meta rendszeréhez egyelőre nem férhetünk hozzá, viszont egyértelmű jel a többi fejlesztőnek, így várhatóan hamarosan mások is előállnak hasonló rendszerekkel, alkalmazásokkal.

meta_ai.jpg

Ezekhez a modellekhez masszív számítási kapacitások kellenek, sokkal nagyobbak, mint a „szövegből állókép” megoldásokhoz. Rövid videókhoz többszáz kép szükséges, tehát a fejlesztésüket egyelőre csak nagy techvállalatok engedhetik meg maguknak. Mivel nincsenek csúcsminőségű videókat szövegekkel összekapcsoló nagy adatsorok, begyakoroltatásuk komoly nehézségekbe ütközik.

A Meta három nyílt forrású kép- és videó-adatsorból kombinálta össze a modell gyakorlásához az adatokat. A felcímkézett állóképekből álló szabványos szöveg-kép adatsorokból az MI megtanulta az objektumok nevét, és hogy hogyan néznek ki.

A videó-adatbázis a tanulás más aspektusában segítette – megismerte, hogy ezek az objektumok hogyan mozognak a világban. (Legalábbis azt, hogy feltételezések alapján, miként hivatottak mozogni…)

A Make-A-Video a két megközelítés kombinációja. Szakértők szerint ígéretes, a modell érzékeli a mélységet és a világítást, a „kamera” 3D-s objektumokat is tud rögzíteni. A részletek és a mozgások is korrektek, de mindezekkel együtt bőven akad finomítani való az MI-n, például objektumok közötti komplex interakciók megjelenítése nyilván nem máról holnapra fog hibátlanra sikerülni.

A Meta elmondta, hogy a technológiával bővülnek a művészek és a kreatív szakmákban dolgozók lehetőségei. Nyilvánvalóan a dezinformáció terjesztésében, kamu videók (deepfakes) generálásában szintén komoly szerepet játszhat egy ilyen MI.

Mesterséges intelligencia, mint szolgáltatás

Egy-két éve, a nagy nyelvi modellekhez csak a trenírozásukhoz és alkalmazásukhoz szükséges, komoly számítási kapacitással rendelkező szervezetek férhettek hozzá. A felhőalapú szolgáltatásokkal ezek a modellek startupok és kutatók szélesebb körében is elérhetők, így pedig nyilvánvalóan több új fejlesztés és felfedezés várható.

A Nvidia bejelentette, hogy két felhőalapú mesterségesintelligencia-rendszeréhez (NeMo LLM, BioNeMo) megkönnyíti a hozzáférést. Fejlesztők szövegeket és biológiai szekvenciákat generálhatnak, inputokat hangoló módszereket dolgozhatnak ki velük. Finomhangolás nélkül teszik lehetővé, hogy webes adatokon gyakoroltatott modellek egyedi felhasználói adatokkal is jól működjenek.

ai_asaservice1.jpg

A felhasználók vagy a „helyszínen”, vagy alkalmazásprogramozói felületen (API) keresztül, sokféle modellt telepíthetnek a felhőben.

A NeMo eszköztárat beszédfelismerésre, szöveg beszéddé alakítására és természetesnyelv-feldolgozásra fejlesztette a Nvidia.

ai_asaservice.jpg

A NemoLLM több nagy nyelvi modellhez biztosít hozzáférést, a felhasználók az úgynevezett prompt learning két módszerével javíthatnak a modellek teljesítményén. (A hagyományosabb módszereknél gyorsabb, promptokkal – természetes nyelvi fogódzókkal, például szavakkal, egyszerű mondatokkal stb. – történő tanulás során a fejlesztők az előre gyakoroltatott modellekkel, proaktívan jelölik ki feladatok kontextusát.)

A BioNeMo segítségével a felhasználók nagy nyelvi modelleket alkalmazhatnak a gyógyszerkutatásban.

A Nvidia nem az egyetlen infokommunikációs vállalat, amely szolgáltatásként kínálja a mesterséges intelligenciát (AI-as-a-Service, AIaaS), két szempontból viszont különbözik a többi nagy nyelvimodell-szolgáltatótól: az egyik az új – prompt – tanulásra fókuszálás, a másik a biológiai alkalmazások.

Emberi hajszálon táncolnak a robotok

Egyre nagyobb a verseny a robotok miniatürizálásában, hogy a különböző egyetemi és vállalati laborokban minél kisebb, de minél jobb gépecskéket fejlesszenek.

A Cornell Egyetem legújabb darabja annyira pici, hogy emberi hajszálon is képes elücsörögni. Saját magától mozog, mozgásának erőforrása a fény.

Pár hónapja hasonló kicsi gépet mutattak be. Pénzérme szélén üldögél, hővel működik, melegítésre kinyújtja, hűtésre összehúzza a lábait.

cornell_robotok.jpg

A mostani fejlesztéseket vezető Michael Reynolds Hangyabotoknak (Antbots) nevezi az új gépeket. Az ok elég egyszerű: akkorák, mint egy hangya, azaz még kisebbek, mint a pénzérmén zsonglőrködő elődjük. A mozgó elektronikus gépecskék abban is különböznek a hasonló korábbi fejlesztésektől, hogy nem feltétlenül kellenek hozzájuk vezetékek, huzalok.

Három fontos alrendszerből állnak össze: fényenergiával működő elemből, az ezt az energiát kontrolláló és irányító kicsi integrált áramkörből, csuklós lábakból, amelyekkel „körbefutja” magát.

A fejlesztők több tervet készítettek a különféle járásmódok illusztrálására. Egy kicsit nagyobb és valamivel többre képes Kutyabotot (Dogbot) is építettek. Mindkét esetben egyetlen egyszerű utasítás, alapvetően a gyorsról lassúra, lassúról gyorsra váltás működik.

A robotok intelligenciája, méretüknek megfelelően, szándékosan korlátozott, ezért nem alkalmasak bonyolultabb logikai műveletek kivitelezésére. A szilícium chip viszont kategóriájában meglepően nagynak számít, 180 nanométer, míg a mai chipek általában 10 nanométer alattiak. Az áramkör méretének egy nagyságrenddel történő csökkentéséhez vagy a robotot is csökkenteni kellene, vagy több intelligenciát kellene beletenni.

A robotok miniatűr méretük ellenére meglepően sok területen, a környezet tisztításától a gyógyszer-ellátás és sejtek folyamatos megfigyeléséig, sejtek stimulálásáig, mikroszkopikus méretű sebészeti beavatkozásokig, több területen alkalmazhatók. Ezeket a munkákat végezve, fedélzeti irányítórendszerük segíti majd őket az érzékelésben, a környezetre való reagálásban.

      

Dübörög a kínai robotgazdaság

Az „ipari robot” kifejezés sok és sokféle gépre érvényes, viszont programozhatónak, több célra használhatónak és automatizált indusztriális alkalmazásokban működőképesnek kell lenniük, különben nem kerülnek be a nemzetközi robotszervezetek statisztikáiba.

A kínai gyárakban tavaly majdnem annyi ipari robotot telepítettek, mint a világ többi részén összesen. Mivel évről évre kevesebb az aktív munkaerő, érthető az automatizálás felgyorsítása, máskülönben a hatalmas ország képtelen megőrizni világelsőségét a gyártásban. A pandémia a lezárásokkal szintén segíti az automatizációt.

chinese_robots.jpg

2021-ben 45 százalékkal több ipari robotot szállítottak ki az országban, mint 2020-ban – áll az International Federation of Robotics (IFR) elemzésében. A nehéz munkát végzők felét szintén Kínában telepítették. Összehasonlításként: közel kétszer annyit, mint az Amerikákon és Európában együtt.

Az automatizációt részben (de csak részben) az indokolja, hogy utolérjék a gazdagabb országokat. Jelenleg Kína a világ második legnagyobb gazdasága, de robotikában a gyors fejlődés ellenére nemcsak az USA, hanem Japán, Németország és Dél-Korea egyaránt megelőzi. Másrészt a dráguló munkaerő szintén indokolja a robotokat.

chinese_robots1.jpg

Ezekhez a folyamatokhoz kapcsolódik, hogy demográfiailag, India lakossága akár már 2023-ban meghaladhatja Kínáét, ráadásul Kínában a 20 és 64 év közöttiek száma csökken és a születések száma is változatlanul relatíve alacsony, elöregedik a lakosság, plusz a fiatalok is egyre kevésbé érdeklődnek a gyári munkák iránt. Mivel a munkaerő bővítésére már nem alapozhatnak, és a termelékenység szintén csökken, csak az előre, az automatizáció felé való „menekülés” maradt, csak így tudnak feljebb jutni a közepes átlagjövedelmű országok közül.

A kínai gyárakban telepített robotok nagy része import, legtöbbjük Japánból érkezik. A kínaiak ugyanakkor nagyon befogadók az új robottechnológiákkal, szeretnek kísérletezni velük, használat előtt alaposan letesztelik mindet. 2030-ra 3,2-4,2 millió kínai használatú ipari robotot prognosztizálnak. Ma egymillióan vannak.  

Az automatizáció felpörgetése a magasabb szintű, nagyobb pontosságot igénylő gyártást is segíti, ezekben a robotok jobbak az embernél, olcsóbbak is és könnyebben alkalmazkodnak. Elemzők egybehangzó véleménye, hogy robotok és automatizáció nélkül Kína nem tudja megőrizni világgazdasági szerepét.   

Az USA és a nyugati országok ugyan meg szeretnék szüntetni a Kínától való függést, de a globális gyártás 29 százalékát adó távol-keleti ország még mindig a világ futószalagja.

Káoszelmélet az óceánkutatásban

Az Északi sarkhoz közeli vizekben honos narvál négy-hat méter hosszú, a párosujjú patások rendjébe tartozó emlős, a cetek közül ők merülnek legmélyebbre a jeges tengerbe, óceánba. Viszonylag kicsi bálnáknak számítanak. A klímaváltozás, a környezetpusztító emberi tevékenység és a halászat miatt sajnos egyre kevesebben vannak.

Velük kapcsolatban derült ki, hogy az állati viselkedés szabálytalan mintázatainak okai a káoszelmélet matematikai módszereivel, elektronikusan felcímkézett narvál adatainak elemzésével is kutatható.

narval.jpg

A Hokkaidó Egyetemen dolgozó nemzetközi kutatócsoport az állat merülését vizsgálva jutott el eddig a felismerésig.

„Az állatok által viselt óceáni érzékelők folyamatosan fejlődnek, és egyre több adatot gyűjtenek. Nincs viszont adekvát módszer a szabálytalan viselkedés elemzésére” – magyarázza a kutatás kiindulópontját Jevgenyij Podolszkij geofizikus.

A jelenségek előrejelezhetetlenségével foglalkozó káoszelmélet pontosan a szabálytalanságok azonosításában segít. A véletlenszerű szabálytalanságokra és rendezetlen állapotú, de legalábbis annak tartott rendszerekre összpontosít. Az elmélettel, más eljárásokkal nehezen meghatározható fontos mintázatok azonosításával, dinamikus rendszerek kaotikus viselkedése értelmezhető.

narval0.jpg

A narvált 83 napon keresztül figyelve, vették észre az állat szabálytalan merülését és vízfelszíni pihenését. Káoszelméleti egyenletekkel elemezve próbálták kideríteni az okokat.

Jelfeldolgozással az adatokat közvetlen megfigyeléssel, az állatra szerelt érzékelők adataiból készült naplók (biologging) követésével nem vizualizálható adatokat sikerült megjeleníteniük.

Narválok viselkedésében soha nem látott jegyeket, tevékenységük egyik mindennapos mintázatát, a mintázat évszakváltás miatti módosulását mutatták ki. Például a vízben lévő jég mennyiségének növekedése azért függ össze az intenzívebb merüléssel, mert korlátozza a narvál felszíni tevékenységét.

A módszer viszonylag egyszerű, könnyű implementálni, hosszú ideig érvényes adatok feltérképezésére és címkézésére alkalmas, kimutatja egyes állatok és más fajok viselkedésbeli különbségeit, és a változó impulzusok miatti zavarokat is detektálja – magyarázzák a kutatók.

Az új módszerrel összegyűjtött információkra támaszkodva, kihalás által fenyegetett fajok is megmenthetők – hangsúlyozzák.

Ha mindehhez hozzátesszük a gépi tanulás fejlődését, kaotikus rendszerekre is ki lehet majd dolgozni szisztematikus és általános vizsgálatokat – az egész életre, és nemcsak az óceánokra.

Jönnek a nevető robotok

A nevetés szerepe közösségenként, kultúránként változik kultúrákon ível át, embereket hoz össze. A kacarászás, kuncogás, röhögés fontosak érzelmi kapcsolatok kialakulásában, egymáshoz való kötődésben, egy sereg alapvető ember-ember interakcióban.

Gépi változata, az automatizált nevetés egyáltalán nem tréfa. Ha egy gép elsajátítja, mikor és hogyan kell nevetni, a rendszer érdekesebbé válik, sokkal jobban megy neki az emberekkel folytatott kommunikáció.

Japán szakemberek erre tettek kísérletet.

lol_robors.jpg

A Kyoto Egyetem kutatói idegháló-sorozatot fejlesztettek, amely lehetővé teszi, hogy az emberekkel beszélgető robotok nevethessenek.

A sorozat három modellből áll, a felhasználó beszédalapú inputja alapján, a robot vagy erőteljes röhögéssel, vagy kuncogással, vagy fapofával, nevetés nélkül reagál rá. A modelleket gyors ismerkedési randevúk dialógusain gyakoroltatták. A párbeszédek különlegessége, hogy emberek és Erica, egy android között folytak. Az androidot színésznő távműködtette, a szövegekben rengeteg megmosolyogni való rész volt. Azért döntöttek Erica és nem chatbot mellett, mert az androiddal folytatott párbeszédek mélyebbek, szerteágazóbb tematikájúak.

Az első modell az egyik beszélő nevetését detektálta. A háló megtanulta definiálni, hogy egy megnyilatkozás mikor érhet véget nevetéssel. A második arról döntött, hogy a beszélő megnyilvánulása mikor vált ki szimpatikus kuncogást. A hang tulajdonságait, legalacsonyabb frekvenciáját és hangerejét betáplálták egy modellbe, amelyik aztán beletanult, hogy nevetéssel reagáljon-e, vagy sem. A harmadik a nevetés típusát választja ki. Gyakorlás után a modell tudta, mikor milyen felvételt kell lejátszania.

A teszten a fejlesztők rendszere és két alapkonfiguráció nevetést is tartalmazó rövid monológokra reagált, miközben közösségi ötletbörzével (crowdsourcing) összegyűjtött harminc személy 1-től 7-ig terjedő skálán pontozta a nevetés természetességét, emberi jellegét.

A rendszer a természetességből 4,01, emberszerűségből 4,36 pontot ért el. A soha nem nevető alapbeállítás 3,88-at és 3,99-et, a mindig nevető 3,83-at és 4,16-ot teljesített.

Adattudósok az adattudományról

2021 és 2031 között 21 százalékkal nő a számítástudományi, információtechnológiai kutatók száma – prognosztizál az Egyesült Államok Munkastatisztikai Hivatala. A szektoronkénti öt százalékos átlagot jelentős mértékben meghaladó növekedés kevésbé bíztató oldala, hogy már ma is nagyobb a mesterségesintelligencia-szakemberek iránti kereslet, mint az ezen a területen állást keresők száma.

A népszerű Python disztribúciót jegyző Anaconda által végzett 2022-es „Az adattudomány állapota” felmérésben 3493 az adattudományban, mesterségesintelligencia-kutatásban és gépi tanulásban dolgozó diák, tanár és alkalmazott vett részt. 133 országot képviseltek, 40 százalékuk amerikai vagy kanadai, 76 százalékuk férfi, 23 nő, 1 nem-bináris. Többségük, 55 százalék ezernél kevesebb, 15 százalékuk tízezernél több személyt alkalmazó vállalatnál dolgozik.

datascience_1.jpg

Napi munkájuk több oldaláról, jövőbeli reményeikről kérdezték őket. Általában elégedettek, de aggodalmaikat is elmondták.

70 százalékuk mérsékelten elégedett a munkájával, a tanárok és az oktatók a legelégedettebbek.

datascience0.jpg

Munkájuk 51 százalékát adattisztítással vagy vizualizálással, 18 százalékát modellek kiválasztásával és gyakoroltatásával töltik. A modellel dolgozók 60 százaléka helyszíni erőforrásokat, 40 százaléka a számítási felhőt használja. Zömük a Pythont kedveli, 31 százalékuk minden nap használja. Az SQL 16 százalékot, míg a C/C++, a Java, a Rust egyszámjegyű százalékot ért el a népszerűségi listán. A megkérdezett diákok 27 százaléka bejáratott startupnál, 23 százaléka valamelyik óriáscégnél, 22 százaléka pedig akadémiai intézménynél vagy kutatólaboratóriumban szeretne dolgozni.

Személyes és az adattudomány előtt álló kihívásokról szintén elmondták a véleményüket.

Sokak szerint cégük, iskolájuk jobban támogathatná a munkájukat. A nem elegendő befektetést (65 százalék), a tehetségek nehéz elérését (56 százalék), valamint a valóságtól elrugaszkodott elvárásokat (43 százalék) jelölték meg legnagyobb akadályként. A szakmai gyakorlatok megtalálását, a nem világos álláshirdetéseket, a szakmai hálózatok és a mentoring hiányát szintén említették (27, 20, 15 százalék).

62 százalékuk szerint szervezetüket/cégüket legalább enyhén érinti a szakképzett munkaerő hiánya. A munkaviszonyban állók 38 százaléka tehetséges mérnökök, 33 százaléka valószínűségszámítás- és statisztika-szakemberek hiányára panaszkodott. 32 százalékuk az elfogultság társadalmi hatásában, 18 százalékuk a személyes adatok biztonságában (privacy), 16 százalékuk a fejlett információs hadviselésben látja a szakterület legnagyobb problémáját.

Egyre jobbak a mesterséges intelligenciák a képalkotásban

A szöveges utasítások alapján képet generáló algoritmusok, és általánosságban a képtechnológia az utóbbi évek mesterségesintelligencia-fejlesztéseinek egyik legígéretesebb ága. Az idei év áttörés, mert MI-ket ugyan tavaly és tavalyelőtt is használtak képalkotásra, viszont nagyon kevesen férhettek hozzájuk. 2022 második felében jutottunk el addig, hogy egyes algoritmusokat jóval többen, szélesebb körben, ingyen alkalmazhatunk.

A gépi tanulás egyik legavatottabb szakértője, az amerikai-kínai Andrew Ng a Müncheni Műszaki Egyetemen fejlesztett Stable Diffusion-ben látja a fordulópontot, és egyben mérföldkövet is az MI történetében. A modell ingyen letölthető, szabadon futtatható a felhasználó hardverén. Ironikus módon sokkal közelebb áll a nyílt MI-hez, mint a magát nyílt MI-nek nevező kaliforniai OpenAI DALL-E rendszere (vagy a Google hasonló megoldásai).

image_generators2.jpg

Az MI-vel történő képgenerálás ugyan még nem kiforrott technológia, de máris nagy durranás. Sok kreatív személy rendelkezik művészi tehetséggel, viszont pocsékul rajzol. Ng magáról is beszél, bár amatőr illusztrátori munkája kimerül a lányának készített rajzokban (az első kép bal oldalán Ng, jobb oldalán a Stable Diffusion a kutató iránymutatása alapján készült pandája).

Valódi művészek számára a képgenerátorok óriási segítséget jelentenek, fantáziájukat jobban kiélhetik velük. Így készült alkotás már meg is nyert egy művészi versenyt a Colorado Állami Képvásáron.

image_generators1.jpg

A nagyteljesítményű okostelefon-kamerák robbantottak a fényképezésben, és ma már kevés fotóhoz kell igazi professzionális gép. Ng hasonlót vár az MI képgenerátoroktól a képzőművészetben: az egyre jobb modellekkel és felhasználói interfészekkel – MI-vel – eredményesebben teremthető művészi érték, mint nélkülük. A jövőben több műalkotás születik mesterséges intelligencia közreműködésével, mint nélküle, és végre a rosszul rajzoló, de nagyon kreatív alkotók is értékes munkákkal állhatnak elő.

image_generators.jpg

Ng egyik kollégája az MI helyettesítheti-e a radiológusokat kérdésre azt válaszolta, hogy az MI-t használó radiológusok fogják helyettesíteni az MI-t nem használó kollégáikat. A képzőművészetben hasonló tendencia érvényesülhet. A múltban is mindig az új technológiákat alkalmazó alkotók értek el nagyobb sikereket.

image_generators0.jpg

Az emberi fogyasztásra generált képek, fotorealista ábrázolások (lásd Obama elnök Stable Diffusion-nel készített portréja) mellett az algoritmusok gépi fogyasztásra szintén készítenek vizuális anyagokat. Több cég például gépilátás-algoritmusok betaníttatásához szükséges gyakorlóképek készítésére fejleszt technikákat. Ng szerint ezekkel az algoritmusokkal jelentősen csökkenhetnek az adatgenerálás és gépek közötti (machine-to-machine) más folyamatok költségei is.

süti beállítások módosítása