Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Káoszelmélet az óceánkutatásban

2022. szeptember 28. - ferenck

Az Északi sarkhoz közeli vizekben honos narvál négy-hat méter hosszú, a párosujjú patások rendjébe tartozó emlős, a cetek közül ők merülnek legmélyebbre a jeges tengerbe, óceánba. Viszonylag kicsi bálnáknak számítanak. A klímaváltozás, a környezetpusztító emberi tevékenység és a halászat miatt sajnos egyre kevesebben vannak.

Velük kapcsolatban derült ki, hogy az állati viselkedés szabálytalan mintázatainak okai a káoszelmélet matematikai módszereivel, elektronikusan felcímkézett narvál adatainak elemzésével is kutatható.

narval.jpg

A Hokkaidó Egyetemen dolgozó nemzetközi kutatócsoport az állat merülését vizsgálva jutott el eddig a felismerésig.

„Az állatok által viselt óceáni érzékelők folyamatosan fejlődnek, és egyre több adatot gyűjtenek. Nincs viszont adekvát módszer a szabálytalan viselkedés elemzésére” – magyarázza a kutatás kiindulópontját Jevgenyij Podolszkij geofizikus.

A jelenségek előrejelezhetetlenségével foglalkozó káoszelmélet pontosan a szabálytalanságok azonosításában segít. A véletlenszerű szabálytalanságokra és rendezetlen állapotú, de legalábbis annak tartott rendszerekre összpontosít. Az elmélettel, más eljárásokkal nehezen meghatározható fontos mintázatok azonosításával, dinamikus rendszerek kaotikus viselkedése értelmezhető.

narval0.jpg

A narvált 83 napon keresztül figyelve, vették észre az állat szabálytalan merülését és vízfelszíni pihenését. Káoszelméleti egyenletekkel elemezve próbálták kideríteni az okokat.

Jelfeldolgozással az adatokat közvetlen megfigyeléssel, az állatra szerelt érzékelők adataiból készült naplók (biologging) követésével nem vizualizálható adatokat sikerült megjeleníteniük.

Narválok viselkedésében soha nem látott jegyeket, tevékenységük egyik mindennapos mintázatát, a mintázat évszakváltás miatti módosulását mutatták ki. Például a vízben lévő jég mennyiségének növekedése azért függ össze az intenzívebb merüléssel, mert korlátozza a narvál felszíni tevékenységét.

A módszer viszonylag egyszerű, könnyű implementálni, hosszú ideig érvényes adatok feltérképezésére és címkézésére alkalmas, kimutatja egyes állatok és más fajok viselkedésbeli különbségeit, és a változó impulzusok miatti zavarokat is detektálja – magyarázzák a kutatók.

Az új módszerrel összegyűjtött információkra támaszkodva, kihalás által fenyegetett fajok is megmenthetők – hangsúlyozzák.

Ha mindehhez hozzátesszük a gépi tanulás fejlődését, kaotikus rendszerekre is ki lehet majd dolgozni szisztematikus és általános vizsgálatokat – az egész életre, és nemcsak az óceánokra.

Jönnek a nevető robotok

A nevetés szerepe közösségenként, kultúránként változik kultúrákon ível át, embereket hoz össze. A kacarászás, kuncogás, röhögés fontosak érzelmi kapcsolatok kialakulásában, egymáshoz való kötődésben, egy sereg alapvető ember-ember interakcióban.

Gépi változata, az automatizált nevetés egyáltalán nem tréfa. Ha egy gép elsajátítja, mikor és hogyan kell nevetni, a rendszer érdekesebbé válik, sokkal jobban megy neki az emberekkel folytatott kommunikáció.

Japán szakemberek erre tettek kísérletet.

lol_robors.jpg

A Kyoto Egyetem kutatói idegháló-sorozatot fejlesztettek, amely lehetővé teszi, hogy az emberekkel beszélgető robotok nevethessenek.

A sorozat három modellből áll, a felhasználó beszédalapú inputja alapján, a robot vagy erőteljes röhögéssel, vagy kuncogással, vagy fapofával, nevetés nélkül reagál rá. A modelleket gyors ismerkedési randevúk dialógusain gyakoroltatták. A párbeszédek különlegessége, hogy emberek és Erica, egy android között folytak. Az androidot színésznő távműködtette, a szövegekben rengeteg megmosolyogni való rész volt. Azért döntöttek Erica és nem chatbot mellett, mert az androiddal folytatott párbeszédek mélyebbek, szerteágazóbb tematikájúak.

Az első modell az egyik beszélő nevetését detektálta. A háló megtanulta definiálni, hogy egy megnyilatkozás mikor érhet véget nevetéssel. A második arról döntött, hogy a beszélő megnyilvánulása mikor vált ki szimpatikus kuncogást. A hang tulajdonságait, legalacsonyabb frekvenciáját és hangerejét betáplálták egy modellbe, amelyik aztán beletanult, hogy nevetéssel reagáljon-e, vagy sem. A harmadik a nevetés típusát választja ki. Gyakorlás után a modell tudta, mikor milyen felvételt kell lejátszania.

A teszten a fejlesztők rendszere és két alapkonfiguráció nevetést is tartalmazó rövid monológokra reagált, miközben közösségi ötletbörzével (crowdsourcing) összegyűjtött harminc személy 1-től 7-ig terjedő skálán pontozta a nevetés természetességét, emberi jellegét.

A rendszer a természetességből 4,01, emberszerűségből 4,36 pontot ért el. A soha nem nevető alapbeállítás 3,88-at és 3,99-et, a mindig nevető 3,83-at és 4,16-ot teljesített.

Adattudósok az adattudományról

2021 és 2031 között 21 százalékkal nő a számítástudományi, információtechnológiai kutatók száma – prognosztizál az Egyesült Államok Munkastatisztikai Hivatala. A szektoronkénti öt százalékos átlagot jelentős mértékben meghaladó növekedés kevésbé bíztató oldala, hogy már ma is nagyobb a mesterségesintelligencia-szakemberek iránti kereslet, mint az ezen a területen állást keresők száma.

A népszerű Python disztribúciót jegyző Anaconda által végzett 2022-es „Az adattudomány állapota” felmérésben 3493 az adattudományban, mesterségesintelligencia-kutatásban és gépi tanulásban dolgozó diák, tanár és alkalmazott vett részt. 133 országot képviseltek, 40 százalékuk amerikai vagy kanadai, 76 százalékuk férfi, 23 nő, 1 nem-bináris. Többségük, 55 százalék ezernél kevesebb, 15 százalékuk tízezernél több személyt alkalmazó vállalatnál dolgozik.

datascience_1.jpg

Napi munkájuk több oldaláról, jövőbeli reményeikről kérdezték őket. Általában elégedettek, de aggodalmaikat is elmondták.

70 százalékuk mérsékelten elégedett a munkájával, a tanárok és az oktatók a legelégedettebbek.

datascience0.jpg

Munkájuk 51 százalékát adattisztítással vagy vizualizálással, 18 százalékát modellek kiválasztásával és gyakoroltatásával töltik. A modellel dolgozók 60 százaléka helyszíni erőforrásokat, 40 százaléka a számítási felhőt használja. Zömük a Pythont kedveli, 31 százalékuk minden nap használja. Az SQL 16 százalékot, míg a C/C++, a Java, a Rust egyszámjegyű százalékot ért el a népszerűségi listán. A megkérdezett diákok 27 százaléka bejáratott startupnál, 23 százaléka valamelyik óriáscégnél, 22 százaléka pedig akadémiai intézménynél vagy kutatólaboratóriumban szeretne dolgozni.

Személyes és az adattudomány előtt álló kihívásokról szintén elmondták a véleményüket.

Sokak szerint cégük, iskolájuk jobban támogathatná a munkájukat. A nem elegendő befektetést (65 százalék), a tehetségek nehéz elérését (56 százalék), valamint a valóságtól elrugaszkodott elvárásokat (43 százalék) jelölték meg legnagyobb akadályként. A szakmai gyakorlatok megtalálását, a nem világos álláshirdetéseket, a szakmai hálózatok és a mentoring hiányát szintén említették (27, 20, 15 százalék).

62 százalékuk szerint szervezetüket/cégüket legalább enyhén érinti a szakképzett munkaerő hiánya. A munkaviszonyban állók 38 százaléka tehetséges mérnökök, 33 százaléka valószínűségszámítás- és statisztika-szakemberek hiányára panaszkodott. 32 százalékuk az elfogultság társadalmi hatásában, 18 százalékuk a személyes adatok biztonságában (privacy), 16 százalékuk a fejlett információs hadviselésben látja a szakterület legnagyobb problémáját.

Egyre jobbak a mesterséges intelligenciák a képalkotásban

A szöveges utasítások alapján képet generáló algoritmusok, és általánosságban a képtechnológia az utóbbi évek mesterségesintelligencia-fejlesztéseinek egyik legígéretesebb ága. Az idei év áttörés, mert MI-ket ugyan tavaly és tavalyelőtt is használtak képalkotásra, viszont nagyon kevesen férhettek hozzájuk. 2022 második felében jutottunk el addig, hogy egyes algoritmusokat jóval többen, szélesebb körben, ingyen alkalmazhatunk.

A gépi tanulás egyik legavatottabb szakértője, az amerikai-kínai Andrew Ng a Müncheni Műszaki Egyetemen fejlesztett Stable Diffusion-ben látja a fordulópontot, és egyben mérföldkövet is az MI történetében. A modell ingyen letölthető, szabadon futtatható a felhasználó hardverén. Ironikus módon sokkal közelebb áll a nyílt MI-hez, mint a magát nyílt MI-nek nevező kaliforniai OpenAI DALL-E rendszere (vagy a Google hasonló megoldásai).

image_generators2.jpg

Az MI-vel történő képgenerálás ugyan még nem kiforrott technológia, de máris nagy durranás. Sok kreatív személy rendelkezik művészi tehetséggel, viszont pocsékul rajzol. Ng magáról is beszél, bár amatőr illusztrátori munkája kimerül a lányának készített rajzokban (az első kép bal oldalán Ng, jobb oldalán a Stable Diffusion a kutató iránymutatása alapján készült pandája).

Valódi művészek számára a képgenerátorok óriási segítséget jelentenek, fantáziájukat jobban kiélhetik velük. Így készült alkotás már meg is nyert egy művészi versenyt a Colorado Állami Képvásáron.

image_generators1.jpg

A nagyteljesítményű okostelefon-kamerák robbantottak a fényképezésben, és ma már kevés fotóhoz kell igazi professzionális gép. Ng hasonlót vár az MI képgenerátoroktól a képzőművészetben: az egyre jobb modellekkel és felhasználói interfészekkel – MI-vel – eredményesebben teremthető művészi érték, mint nélkülük. A jövőben több műalkotás születik mesterséges intelligencia közreműködésével, mint nélküle, és végre a rosszul rajzoló, de nagyon kreatív alkotók is értékes munkákkal állhatnak elő.

image_generators.jpg

Ng egyik kollégája az MI helyettesítheti-e a radiológusokat kérdésre azt válaszolta, hogy az MI-t használó radiológusok fogják helyettesíteni az MI-t nem használó kollégáikat. A képzőművészetben hasonló tendencia érvényesülhet. A múltban is mindig az új technológiákat alkalmazó alkotók értek el nagyobb sikereket.

image_generators0.jpg

Az emberi fogyasztásra generált képek, fotorealista ábrázolások (lásd Obama elnök Stable Diffusion-nel készített portréja) mellett az algoritmusok gépi fogyasztásra szintén készítenek vizuális anyagokat. Több cég például gépilátás-algoritmusok betaníttatásához szükséges gyakorlóképek készítésére fejleszt technikákat. Ng szerint ezekkel az algoritmusokkal jelentősen csökkenhetnek az adatgenerálás és gépek közötti (machine-to-machine) más folyamatok költségei is.

Marsjárókat és marsi drónokat teszteltek a jeges izlandi szélben

A Marsra készülő drónok és terepjárók prototípusait tesztelte nyáron a kanadai Nyugati Egyetem Izland mostoha időjárású részén, jeges szélben.

„Életemben nem láttam még ilyen őrült szelet. Drónok nem tudnak repülni ekkora szélben, és embereket sem akartunk kockáztatni” – nyilatkozta Catherine Neish, a felsőoktatási intézmény bolygógeológusa.

izland.jpg

Amikor az időjárási feltételek minimálisan javultak, kiderült, hogy robotok és emberek tudnak alkalmazkodni hozzájuk. Drónok, terepjárók és emberek koordinált marsi, holdbéli tevékenységét igyekeztek szimulálni.

Izland ideális terep űrmissziók próbájához. A sziget sok része, lávás területek, gleccserek és hegyek földönkívüli közegekre emlékeztetnek. Mivel kis ország, rövid idő alatt többféle terep tesztelhető.

izland0.jpg

Neish és csapata a sziget közepén lévő, 2014 végén és 2015 elején kitört lávafolyam-helyszínen végezték kutatómunkájukat. A Marson ugyan nem tudunk aktív vulkánról, és az ottani erózió a földihez képest relatíve lassú, viszont a terep és a közeli gleccserek miatt mégis sok a hasonlóság a vörös bolygóval.

A lávánál a Honeybee Robotics által fejlesztett, mintavevő eszközzel felszerelt drónt vizsgáltak. A munka hasznos lehet a NASA számára a Marson drónok és terepjárók által gyűjtött minták tanulmányozásához.

A Kanadai Űrügynökség MERS (Mars Exploration Science River) terepjáróját és az Arizonai Egyetem drónjait szintén tesztelték. A teszteken a Nemzetközi Űrállomás kanadai robotkarját működtető személyzet és a Reykjavik Egyetem kutatói is részt vettek.

A terepjárókat és a drónokat egymástól függetlenül ieányították a NASA kaliforniai Sugárhajtású Laboratóriumának (JPL) távközreműködésével. A JPL mérnökei az interneten küldték az utasításokat, amelyek alapján a helyszíniek terveket dolgoztak ki.

Jelenleg az izlandi kirándulás adatait elemzik, a következő helyszíni teszteket 2023-ban fogják végezni. Bizakodnak, hogy a terepjárók és a drónok koordinációja hatékonyabb és a széljárás is kedvezőbb lesz.

Hordozható okos kütyü figyeli a rákos daganatokat

A Stanford Egyetem kutatói rugalmas és nyújtható szenzorral felszerelt, az emberi bőrhöz ragasztható, tumorok méretváltozását figyelő, kicsi és autonóm eszközt fejlesztettek. A nem invazív, elemmel működő kütyü tíz mikrométernyi módosulásokat is képes észlelni, az eredményeket pedig vezeték nélkül, valósidőben egyetlen gombnyomásra juttatja el okostelefon-alkalmazásra.

A kütyü neve FAST (Flexible Autonomous Sensor measuring Tumors, tumorokat mérő rugalmas, autonóm érzékelő, a rövidítés gyorsat jelent), amely teljesen új, gyors, nem drága, pontos eszköz rákellenes gyógyszerek hatékonyságának tesztelésére, és a rosszindulatú daganatok elleni küzdelem új irányait jelölheti ki.

tumor_monitor.jpg

Évente többezer potenciális rákellenes gyógyszert tesztelnek egereken, amelyek közül kevesen jutnak el emberi alkalmazásokig. Új gyógymódok kidolgozása azért is lassú, mert maguk a tumor csökkenését mérő technológiák lassúak, akár hetekig is várhatunk az eredményekre. A rák biológiai sokszínűsége, a meglévő mérési módszerek hiányosságai és a viszonylag kisméretű minták miatt hatékony gyógyszerek fejlesztése nehéz és munkaigényes. Egyes esetekben a mérések még ma is kézzel, körzővel történnek.

Fémből készült fogószerű eszközök, például körzők használata puhaszövetek mérésére minden, csak nem ideális, a radiológiai megközelítés pedig nem szolgáltat folyamatosan adatot a valósidejű állapotelemzésekhez.

Itt jön képbe a daganat méretéről percenként adatokat küldő FAST.

Érzékelője rugalmas és nyújtható, bőrszerű polimerből áll, amelybe egy réteg arany áramkört ágyaztak be. A szenzor kicsi elektronikus hátizsákhoz kapcsolódik. A készülék méri a membrán igénybevételét, hogy mennyire nyúlik, vagy zsugorodik, és az okostelefonra küldi ezeket az adatokat. A hátizsák közvetítésével a tumor méretcsökkenésével összefüggő potenciális gyógymódok gyorsan és biztonságosan kidolgozhatók.

Egerekkel végzett kísérleteik alapján, a kutatók az új eszköz három előnyét emelték ki: a folyamatos megfigyelést, más módszerekkel nehezen érzékelhető változások észlelését, FAST autonóm és nem invazív jellegét.

A „csomag” újrahasznosítható, összeállítása kb. hatvan dollár, egérre percek alatt felrakható. Az aranyréteg nyúlás közben repedezik, az anyag elektromos vezetőképessége módosul, a szenzor ellenállása nő. Összehúzódáskor pedig a repedések miatt jobban vezeti az áramot.

Milyen egy intelligens szemeteskuka?

Hiába a jó szándék, a szomorú valóság az, hogy az általunk aprólékosan kiválogatott műanyaghulladéknak csak egy részét hasznosítják újra. Egyik legfőbb ok, hogy sem a válogatási módszer, sem az újrahasznosítás nem elég átgondolt.

Például az Ausztrál Statisztikai Hivatal szerint az összes évi szemétnek csak a felét reciklálják, Új Dél-Wales államban pedig a 800 ezer tonna műanyagnak mindössze tíz százalékát, mert nem pontos a válogatás.

„Az újrahasznosítási folyamat egész bonyolult. Ha nagyáruházba megyünk, vagy napi szemetes munkánkat végezzük, tudni kell, hogyan helyezzük a jó kukába az újrahasznosítandó darabokat. Ismernünk kell a címkéket, jeleket” – magyarázza Xu Wang, a Sydney Műszaki Egyetem tanára.

okos_szemetes.jpg

Wang és kutatótársai ebből az alapvetésből kiindulva, automatikusan válogató csúcstechnológiás „intelligens szemétkukát” fejlesztettek. Az eszközbe high-tech megoldásokat, mesterséges intelligenciát, gépi látást, robotikát, dolgok internetét (IoT) integráltak. Változatos szenzorok vizsgálják az adott tárgy tömegét, anyagát stb.

„Többfajta hulladékot, köztük üveget, fémet és műanyagot tud osztályozni” – folytatja Wang, majd kiemelte, hogy a kuka többféle műanyagot ismer fel.

Kamera és mesterségesintelligencia-algoritmus közös munkájának eredményeként különbözteti meg a műanyagokat, míg az IoT és a robotika a hulladék kukába válogatását végzi.

A körkörös gazdaság (circular economy) agendájának szellemében, egy ilyen innováció megtriplázza a hulladékfeldolgozó-ipari munkahelyek számát. Ezt azzal éri el, hogy ösztönzőleg hat a csúcsminőségű újrahasznosított termékek gyártására, új piacok kialakítására.

A lábak nélküli, intelligens kuka egyelőre finomhangolásra váró prototípus, feltalálói viszont már kereskedelmi forgalmazásán gondolkoznak. Bevásárlóközpontokban, mozikban, iskolákban, üzlethelyiségekben, reptereken és sok más helyen szeretnék látni.

„A fogyasztó csak beledobja a szemetet, és megy tovább. Ennyire egyszerű” – összegez Wang.

Huszonöt éven belül földönkívüli életet fedezhetünk fel

Egyelőre még a Marson sem találtunk semmilyen életet, de Sasha Quanz, a Zürichi Szövetségi Technológiai Intézet, az ETH Zürich asztrofizikusa szerint a következő huszonöt évben a naprendszerünkön túli bolygókon felfedezhetjük élőlények nyomait. A kutató és munkatársai több technológiai projekten dolgoznak, amelyekkel választ kaphatnak a földönkívüli lét kérdésére.

Rengeteg exobolygót nem fedeztünk még fel, igaz, van is belőlük egy csomó, mert a Tejút-galaxis több mint százmilliárd csillagának mindegyikéhez legalább egy tartozik. Elképzelhető, hogy sokuk földszerű, és az adott csillagtól pont az életnek kedvező feltételeket jelentő távolságra fekszenek. Például folyékony vízzel rendelkeznek.

alien.jpg

Arról viszont fogalmunk sincs, hogy van-e atmoszférájuk, és ha igen, miből áll. Tehát a légkörüket kellene figyelni, amelyhez új megfigyelési megközelítés szükséges, hogy lefényképezhessük ezeket a bolygókat.

A Webb Űrteleszkóp sajnos nem alkalmas erre. Nemrég ugyan készített képeket a Jupiternél tízszer nagyobb HIP 65426b gázóriásról, de az égitest szülőcsillagához mért távolsága százszor több mint a Földé a Naptól.

alien0.jpg

A teleszkópot eleve nem exobolygók, hanem a legrégebbi csillagok tanulmányozására fejlesztették, és ugyan bolygókról, atmoszférájuk széndioxid- és víztartalmáról is állapított meg érdekes dolgokat, de ezek mind túl távol fekszenek a csillaguktól ahhoz, hogy legyen rajtuk vagy a légkörükben folyékony víz.

Tehát a Webb nem elég robusztus ezeknek a kisebb bolygóknak a vizsgálatára. Quanz és társai viszont speciális képalkotót és spektrográfot fejlesztenek az Európai Űrügynökség egyik chilei megfigyelőállomásában valamikor munkába álló Extrém Széles – például negyven méteres tükörrel rendelkező – Teleszkóphoz (ELT). Ha az ELT elkészül, a világ legnagyobb teleszkópja lesz.

A rendszer elsődleges célja valóban földszerű bolygók fényképezése a legközelebbi csillagok valamelyikének a környékén. Hosszabb távon nemcsak egy, hanem tucatnyi exobolygóról készítenének az atmoszféra vizsgálatára alkalmas képanyagot.

Persze nem biztos, hogy ez a legjobb műszer és módszer a földönkívüli élet tanulmányozására, mert például a Föld atmoszférája interferenciákat okozhat, torzíthatnak a mérések. Lehet, hogy a Webbnél és az ELT-nél is újabb eszközre, sőt, űrutazásra lesz hozzá szükség.

Quanz reménykedik, hogy az ETH Zürichen lerakják a misszió alapjait, és a majd rendelkezésükre álló technológiákkal többet tudnak meg az élet építőkockáiról. Úgy érzi, a valóságtól egyáltalán nem elrugaszkodott jóslat, hogy huszonöt éven belül életet találhatunk a naprendszeren túl.

Szupertelefon az analfabetizmus ellen

A hanggal működtetett okostelefonokkal nagyon fontos, és eddig többé-kevésbé figyelmen kívül hagyott réteget céloznak meg Afrika Szaharától délre fekvő részein – több tízmillió személyt, akik nem tudnak írni, olvasni.

A helyileg fejlesztett és összeszerelt, 92 dolláros elefántcsontparti Szuperfon hangasszisztenssel működik, az reagál az utasításokra. A készüléket azért tervezték, hogy az érintettek a hétköznapi feladatokat kivitelezhetőbbnek érezzék, jobban megértsenek dokumentumokat, eredményesebben kommunikáljanak kormányzati ügynökségekkel, tudják kezelni a bankszámlájukat. Elefántcsontpart kb. negyven százaléka analfabéta.

Szintén fontos szempont, hogy ezek a személyek leküzdjék a csúcstechnológiákkal szembeni előítéleteiket, frusztrációikat.

superphone.jpg

A Ceco cég termékének használója tizenhét helyi és ötven, más afrikai országban beszélt nyelv közül választhat. A fejlesztők ezer fölé szeretnék növelni a nyelvek számát, amellyel a kontinens felét lefednék. Munkájukat mintegy háromezer önkéntes támogatja.

„Sok szervezetnél elsődleges cél az analfabéták megtanítása az írásra-olvasásra, és csak utána jön a technológia, mert ahhoz mindkettőt pontosan kell használni. Mi kihagyjuk az írást-olvasást, és egyből be akarjuk őket kapcsolni a gazdasági és a társadalmi életbe” – nyilatkozta Alain Capo-Chichi, a Ceco benini elnöke.

Az ENSZ 2016-os, utolsó ilyen felmérése alapján, a világ 750 millió felnőtt analfabétájának 27 százaléka Afrika Szaharától délre fekvő részein él. A kontinensen közel kétezer nyelvet beszélnek, egyiket-másikat több tízmillióan, és nemcsak egymás között, hanem más etnikumokkal is azon kommunikálnak.  Egyes nyelvek viszont lényegében csak szűk közösségekben használt dialektusok.

Az alacsony számok és/vagy a gazdasági befolyás hiánya miatt a fejlesztők általában figyelmen kívül hagyják ezeket a kis nyelveket, míg másokra már dolgoztak ki hangasszisztens-alapú megoldásokat. A Ceco nincs egyedül, a ghánai Mobobi például a helyi twi nyelvre fejlesztett asszisztenst (Abena AI), míg a Mozilla a Kelet-Afrikában közel százmillió személy által beszélt szuahélira dolgoz ki hasonló megoldást.

Egyes helyi telekommunikációs szakértők szerint viszont nincs szükség asszisztensekre, mert egyes alkalmazások, például a WhatsApp hangüzenet-szolgáltatása megoldja a problémák zömét. Új telefon helyett bármilyen okostelefonra telepíthető szoftverek kellenének, helyi nyelvekkel – vélik.

Hogyan várják boldog zöldségek a vacsorát?

Hogyan generáljunk szuperszámítógép nélkül, közönséges grafikus kártyával másodpercek alatt szövegből képet, például hogyan „várják boldog zöldségek a vacsorát?”

A kérdés kicsit sci-finek (másrészt bugyutának) hangzik, pedig nem az, mert a Müncheni Ludwig-Maximilian Egyetem (LMU) Stable Diffusion mesterségesintelligencia-modellje képes rá (és a vacsoraváró boldog zöldségekről is tud képet alkotni, lásd a mellékelt ábrát).

Az algoritmust a felsőoktatási intézmény Gépi Látás és Tanulás Csoportja fejlesztette.

stablediffusion.jpg

„Speciális művészi tehetséggel, számítógépes ismeretekkel és különleges hardverrel nem rendelkező laikusok számára is hatékony eszköz a számítógépes képgenerálást utasítás alapján megvalósító új modell. A modell megszünteti a hétköznapi halandók önkifejezési korlátjait” – jelentette ki a fejlesztést vezető Björn Ommer professzor.

Kívülállók mellett természetesen valódi művészek is hasznát vehetik, mert új ötleteiket pillanatok alatt képvázlatokká alakíthatják. A kutatók meg vannak győződve, hogy ezek az új, mesterségesintelligencia-alapú képalkotó eszközök kitágítják a hagyományos kreatív szoftverek, például a Photoshop adta lehetőségeket.

Ha a Photoshop jelentette a képalkotásban azt, mint a szövegszerkesztő a kézzel és írógéppel írásról a számítógépesre történő váltásban, akkor az egyre több szövegről-képre (text-to-image) alapú MI (OpenAI, Google stb.) a vizuális önkifejezés új szintjét hozza el.

Az LMU projektjét a Stability.AI startup segítette, a modellt az ő szervereiken trenírozták. Ommer elmondta, hogy a jóval több számítási kapacitás és gyakorlópélda tették megoldásukat a jelenlegi egyik legerősebb képszintézis-algoritmussá.

A modell – és az utóbbi évek több hasonló algoritmusának – specialitása, hogy hagyományos gépen is jól működik. Néhány éve még teljesen más volt a helyzet…

Ehhez annyi kellett, hogy a több milliárd gyakorlókép lényegét az MI néhány gigabájtos modellbe tömörítse. Egy ilyen algoritmus tudja, miből áll az autó, mik egy művészi stílus jellemzői stb. Ezeket a kulcstényezőket megtanulva, képes további példákat generálni.

„Nagyjából ugyanúgy, mint ahogy egy festőtanuló egy öreg mester workshopján elsajátítja, hogyan fessen a mester stílusában” – magyarázza Ommer.

A kutatók célja, hogy a számítógépek megtanuljanak látni, értsék egy adott kép tartalmát. Modelljük komoly előrelépés ebbe az irányba.

A modell a CreativeML, Open RAIL-M licenc alatt szabadon hozzáférhető.

süti beállítások módosítása