Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

3D számítógépes grafikával elkészítették Tutanhamon fáraó arcát

2023. június 15. - ferenck

Új 3D modellező technikákkal nemzetközi kutatócsoport elkészítette a Krisztus előtt kb. 1342 és 1324 között élt Tutanhamon egyiptomi fáraó koponyájának és lágyszöveteinek a rekonstrukcióját. A rekonstrukció nyilvánosságra hozott adatok és az egyiptológiai irodalom miatt valósulhatott meg. 

Az egyik legismertebb egyiptomi uralkodó végső nyugvóhelye volt az első háborítatlan állapotban megtalált fáraósír. Nyolc-kilenc éves korától mintegy tíz évig uralkodott, az ország történetének egyik legmozgalmasabb, legeseménydúsabb időszakában került trónra.

tutanhamon.jpg

Eredetileg Tutanhatonnak, „Aton élő képmásának” hívták, feltételezett apja, a reformer Ehnaton uralkodásának tizenegyedik évében születhetett. Ehnaton számolta fel a politeizmust, és vezette be a Napisten/napkorong, Aton kultuszát, sokak szerint a monoteizmus egy korai formáját. Egyiptom összes hagyományos istenének imádatát betiltotta.

Az új vallás rövid ideig maradt meg, Tutanhamon utolsó éveire a politeizmust teljesen visszaállították, az uralkodó nevének megváltoztatása, az Aton helyetti Amon a régi istenekhez való visszatérést jelentette.

Tutanhamon pontos külsejéről nem maradt fenn bizonyíték, a rekonstrukcióval viszont többen megpróbálkoztak.

tutanhamon0.jpg

Az első 1983-ban Pat Gatliff törvényszéki művész munkája volt. A fáraó arcát az arról készített röntgenfelvételek alapján alkotott gipszkoponyát használva, rekonstruálta.

A másodikra 2005-ben került sor, ekkor három, egymással összehangolt csapat különböző alkotásait mutatta be az egyiptomi állam. Egy egyiptomi és egy francia csapat tisztában volt a fáraó identitásával, a harmadik, amerikai nem. Az egyiptomiak 3D számítógépes modellezést, a franciák az antropológiai szobrokat készítő Elisabeth Daynes szakértelmét használták, míg az amerikaiak törvényszéki szobrászra hagyatkoztak.

tutanhamon1.jpg

A szobrok az apró különbségek ellenére nagyon hasonlítottak egymásra, és Ehnaton első feleségére, Nofertitire is – nem ő, hanem a jelenlegi feltételezések szerint valószínűleg Ehnaton egyik lánytestvére volt Tutanhamon anyja.

A harmadik rekonstrukció 2022-es. Christian Corbet szobrász tomografikus szkenek alapján készítette el az arc, majd a kutatási eredmények, a szkenek és más adatok felhasználásával a koponya rekonstrukcióját, ezekből pedig úgynevezett 3D-s arc-megközelítést hoztak létre.

Megállapították, hogy a fiatal uralkodónak, valószínűleg genetikai okok miatt, szokatlanul nagyméretű agya volt.

Falcon: nyílt forrású nagy nyelvmodellt fejlesztettek Abu Dhabiban

A szabad kereskedelmi felhasználást engedélyező nyílt forrású licenceknek köszönhetően független fejlesztők, fejlesztőcsoportok is építhetnek akár a nagy techvállalatok termékeivel versenyképes rendszereket. Egy nemrég kiszivárgott Google-feljegyzés szerzője egyenesen a cég üzleti tevékenységét fenyegető jelenségként írt ezekről a nyílt forrású fejlesztésekről.

Az Egyesült Arab Emírségekben, Abu Dhabi Technológiai Innováció Intézetében (TII) pont ilyen, csúcsteljesítményű, nyílt forráskódú nagy nyelvmodellt (large language model, LLM) dolgoztak ki. A neve Falcon (Sólyom), és a szabad kereskedelmi alkalmazásokat engedélyező Apache 2.0 licenccel szerezhető be.

emirsegek.jpg

Eredetileg a TII tízszázalékos „engedélyezési díjat” kért minden olyan felhasználótól, akik egymillió dollárnál több bevételt generálnak a Sólyomra épülő kereskedelmi alkalmazásokkal. Aztán meggondolták magukat, ejtették a korlátozást, és a mostani licenc sokkal engedékenyebb.

A negyvenmilliárd paraméteres modellt arra tanították be, hogy egybillió tokenes szövegben előrejelezze a következő tokent. Architektúrája az OpenAI GPT-3-jához hasonló, néhány eltéréssel, például a kevesebb memóriaigényű algoritmusokat használ egyes következtetésekhez.

Az előzetesen transzformerekkel gyakoroltatott modell négy verziója szerezhető be: az általános rendeltetésű Falcon-40B, a chatre kitalált Falcon-40B-Instruct, a kompaktabb Falcon-7B és a Falcon-7B-Instruct.

A Sólyom komoly előnye, hogy a nyílt forráskódú nagy nyelvmodelleknél, versenytársainál, különösen a legfőbb rivális – Meta-fejlesztés – LLaMA-nál jobb teljesítményre képes, ráadásul a gyakoroltatás költségei alacsonyabbak, és így energiatakarékosabb is.

Az a tény, hogy Abu Dhabiban ilyen nagy nyelvmodellt fejlesztettek, egyértelműen jelzi a terület globálissá válását, hogy a mesterséges intelligenciában egyre több helyen, egyre több tehetség tűnik fel, az Egyesült Államokon és Kínán kívül más országok is felkerültek a generatív MI-világtérképre.

Feléleszti-e a halódó virtuális valóságot az Apple csúcskategóriás headsetje?

Az 1980-as és 1990-es évek cyberpunk művei általában high-tech alapú disztópikus jövőt vetítettek előre. A virtuális valóság (VR) valamilyen formában nagyon sokban megjelent, részben arra a tényre is reflektálva, hogy a számítógépek fejlődésével, az internettel, a történelemben először mosódtak össze a fizikai és a digitális világ határai. Mindannyian rácsodálkoztunk a szédítő lehetőségekre, köztük a VR-re is.

A hálózatokat ma már az infokom nagyvállalatok uralják, a világok közötti képlékeny határokhoz pedig hozzászoktunk. A virtuális valóságot viszont nem tudtuk megszokni, pedig már a boldog emlékű 1990-es évek közepén úgy tűnt, hogy hamarosan jön a nagy áttörés. A következő „mindent elsöprő” VR-hullám a 2010-es évek közepén kecsegtetett újfent az áttöréssel, hogy aztán szinte semmit ne söpörjön el, és a technológia az IT egyik örök ígérete maradjon.

apple_vr.jpg

A Facebook 2014-ben kétmilliárd dollárért vásárolta meg az akkor legígéretesebb VR headseteket gyártó Oculust. Évekkel később Meta néven újrabrandelte magát, mert Marc Zuckerberg és munkatársai úgy érezték, hogy jön az egyébként először Neal Stephenson 1992-es kultikus cyberpunk regényében, a Snow Crash-ben felvázolt online Metaverzum, fizikai munkahelyünket tömegesen lecseréljük rá, és majd a Minecraftban és hasonló világokban fogunk VR headsettel – sisakkal – a fejünkön dolgozni.

A Metaverzum a reklámkampányba fektetett csillagászati összegek ellenére eddig legalábbis hasonló csőd, mint a Google Glass volt közel egy évtizede. Június első hetében viszont a baljós jelen ellenére új lehetőséget kapott a virtuális valóság – az Apple bemutatta régóta várt Vision Pro headsetjét. Kezdőára tipikus Apple árazás: potom 3500 dollár. (A Meta eszközei nagyságrendekkel olcsóbbak, de azok sem működnek a piacon. Zuckerberg gyorsan le is nyilatkozta, hogy teljesen más az üzleti modelljük, mert ők az átlagfelhasználót célozták meg.)

A „térbeli számításokra” kitalált új VR/AR (az AR a jóval felhasználóbarátabb kiterjesztett valóság, az augmented reality rövidítése) csúcseszköz ideig-óráig újraélesztheti az érdeklődést, viszont nehezen látható át, hogy szélesebb rétegek vásárolják meg. Egyelőre egyetlen nagyvállalat sem talált ki az átlagfogyasztó-tömegek számára vonzó felhasználást a virtuálisvalóság-technológiákra.

A Vision Pro egyébként lenyűgöző technológia, gyönyörű design, hamisítatlan Apple-termék. Biometrikus azonosításhoz, például a FaceID-hez írisz-szkennelés, szemkövetéssel digitális elemekkel léphetünk interakcióba, nyers számítási kapacitásban és kivitelezésben simán kiüti a riválisnak tűnő Oculus és HTC headseteket. Negatívuma, hogy az eleme egy töltéssel csak két órát bír el. A felhasználónak nagyobb televízióra és hangrendszere sincs szüksége, mert a 4K mikro OLED-del megkapjuk. Más kérdés, hogy egy 4K tv ára négyszáz dollár alá ment.

A headset egyelőre csak játékfejlesztők, geekek, tudomány és művészet metszéspontján alkotók fantáziáját mozgatta meg. Ha ők a célközönség, akkor a Vision Pro anyagi értelemben nem lesz sikeres. És az Apple nem nyilatkozott arról, hogy megoldották-e a „sisakok” egyik nagy problémáját: találtak-e ellenszert a felhasználók nem elhanyagolható részében a technológia által okozott mozgás- és tájékozódás-zavarokra?

Jön vagy nem jön a mesterségesintelligencia-apokalipszis?

A mesterséges intelligencia utóbbi időben tapasztalt gyors fejlődése a területtel évtizedek óta foglalkozó szakembereket is annyira meglepte, hogy hajlamosak eltúlozni a veszélyeket. Kétségtelenül rejlenek benne kockázatok, de apokaliptikus jövőképek felvázolása helyett – James Cameron már a Terminátor-filmek legújabb darabját tervezi –, célszerűbb lenne azok átgondolt feltárása.

Két hete a safe.org az MI kockázatait a világjárványokéhoz és a nukleáris háborúéhoz hasonlító, nagy médiavisszhangban részesült anyagot tett közzé, amelyet a mélytanulás (deep learning) két úttörője, Yoshua Bengio és Geoffrey Hinton is aláírt. Soros György a technológiát ugyanolyan veszélyesnek tartja, mint az éghajlatváltozást és Oroszország Ukrajna elleni invázióját – „halálos fenyegetés a nyílt társadalomra.” Egyes ismert technológiai oldalak, mint a régebben referenciának számító Futurism szinte kizárólag csak az MI-t kárhoztató, „utolsóítélet-nap” cikkeket közölnek a témában, és például az OpenAI vezérigazgató Sam Altman-nek azt is felrótták, hogy csak most látta az MI-ről szóló (disztópikus) 2014-es Ex Machinát.

ai_doomsday.jpg

Hinton elmondta a BBC-nek, hogy megkérdőjelezi életműve értelmét, Bengio pedig reális veszélyre, Mi-vel történő vegyi fegyverek gyártására figyelmeztetett. Mi történik, ha hadseregek, terroristák, személyes bosszút tervező egyének ilyen célra használják? – teszi fel a kérdést. Szerinte a kormányoknak regisztrálnia kellene a fejlesztőket, és ugyanúgy figyelni, felügyelni a munkájukat, mint ahogy a gyógyszer- és a légjármű-ipari vállalatokkal teszik. Számítástudományi szakembereknek képesítéssel járó etikai tréningen kellene átesniük. Egy blogbejegyzésben a saját céljait követő MI-ről is írt, májusban pedig az MI Biztonsági Központ a mesterséges intelligencia akár az emberi faj kipusztulásáig vezető működésével riogató közleményét írta alá.

Andrew Ng, az egyik legelismertebb gépitanulás-szakértő és a józan hangok egyike múlt heti hírlevelében megemlítette, hogy nehezen tudja elképzelni, miként jelenthet az MI az emberiség pusztulásához vezető veszélyt. Az előítéletek, az elfogultság, a pontatlan outputok, állások megszűnése, a hatalomkoncentráció valós problémák, viszont mindezek ellenére, az MI a társadalom előnyére válik. Javít az egészségügy és az oktatás minőségén, biztonságosabbá teszi a járműveket, hozzájárul az egészségesebb táplálkozáshoz, javakat és szolgáltatásokat tesz elérhetőbbé, demokratizálja az információhoz való hozzáférést.

ai_doomsday0.jpg

Ng nincs egyedül.

Chris Manning, ausztrál gépitanulás-szakértő szerint az MI-közösség nagy része, a csendes többség hasznos szoftvereket fejleszt, és nem osztja a „hangos MI Biztonság tömeg” kipusztulásos rémképeit. A kockázatokat eltúlozzák – jelentette ki.

Emily Bender, amerikai nyelvész a valós kockázatoktól (diszkrimináció, megfigyelés, információs ökoszisztéma szennyezése, adatlopás, munkaerő kizsákmányolása) való elterelést lát az „MI-ítéletnap” indokolatlan túlhangsúlyozásában.

„Az MI-átokban hívés (doomerism) csali” – írja Matteo Wong, a The Atlantic tudományos, technológiai és egészségügyi szerkesztője. A szabályozók rengeteg időt töltenek el azzal, hogy megakadályozzák a mesterséges intelligenciát autonóm nukleáris fegyverek gyártásában, pedig egyetlen atomhatalom sem tervez még ilyet. Ezt az időt célszerűbb lenne az adatok és a személyiségi jogok védelmével, vagy az MI átláthatóságával és a trösztellenességgel tölteni – javasolja.

A világháló őskorának egyik hőse (a Netscape társalapítója, az első széles körben használt webböngésző, a Mosaic társfejlesztője stb. stb.), Marc Andreessen az MI előnyeiről írt tanulmányt. Minden egyes új technológia megjelenésekor előrejelezhető módon kitört a morális pánik: a liftek agylázat okoznak, az autók elpusztítják a világot, a rögzített hanganyagok ártanak a csecsemőknek és így tovább. A mélytanulás kezdetén, tíz éve Elon Musk és Stephen Hawking figyelmeztetett az MI veszélyeire.

Most ugyanaz folyik, mint tíz éve, csak több neves tudós is fél – fűzi hozzá Ng.

A vita nyilván sokáig folytatódik.

Maximum háromórás szárazföldi utazás a kontinens egyik végpontjából a másikba

A hyperloop technológia lényege, hogy utasszállító kapszulák villanymotor által hajtott, légritkított csőben haladnak. Megvalósulásával jelentősen felgyorsul majd a földi személy- és teherszállítás, a következő évtizedben az egymástól 350 kilométerre fekvő városok közötti távolság félóra alatt tehető meg. Igazából nem vasút, hanem a legjobb vonatokat és repülőket kombináló, teljesen új közlekedési eszköz.

Az eredeti ötlet, a Hyperloop Alpha Elon Musk cégéhez, a SpaceX-hez fűződik, 2013-ban ötvenhét oldalas tanulmányban mutatták be a technológiát. Musk szerint az új megoldás az ötödik önálló szállítási rendszer. (A közúti, a vasúti, a vízi és a légi közlekedés a másik négy.)

utazas.jpg

Andrés de León, a személy- és teherszállítással egyaránt foglalkozó kaliforniai Hyperloop Transportation Technologies vezérigazgatója szerint a technológiával az összes kontinentális távolság három óra alatt megtehető. 2026 és 2028 között válhat valósággá – emelte ki.

A hyperloop ma már kétmilliárd dolláros globális piac, az előrejelzések szerint 2040-re 800 milliárdos, 2050-re kétbilliós lesz. Egyre több a projekt, a lineáris motort, lebegő rendszert és aerodinamikus meghajtást egybekombináló spanyol Zeleros például már ezer km/h sebességben, fenntartható mobilitásban gondolkozik. A rendszer skálázhatóságán és más piacokon való alkalmazási lehetőségein is dolgoznak, többek között szállítmányok kikötőbeli mozgásának „széntelenítésére” is a hyperloopban látják a megoldást. (A tetőn lévő napelemek öt-tizenöt százalékkal több energiát generálnak, mint amennyit a rendszer fogyaszt.)

A fenntarthatósági elvek betartása egyébként is – szinte minden területen – az elsőszámú szempontok közé tartozik. Nem véletlenül, mert a közlekedés a globális széndioxid-kibocsátás huszonhárom százalékáért felelős, az általa okozott szennyezés költsége 54,1 billiárd dollár.

A környezetbarát szempontok érvényesítése („nettó zéró szén rendszer”) mellett a hyperloop másik nagy előnye a biztonság. A technológia folyamatos monitoring-tevékenységet végző, a kapszulába épített, biztonságos passzív mágneses lebegést garantáló intelligens szenzorokkal működik. A tervek szerint mindezek mellett költséghatékony és kényelmes utazási mód.

A Hyperloop Transportation Technologies hozta létre (a dél-franciaországi Toulouse-ban) az első teljes, négy méter átmérőjű hyperloop-tesztrendszert és az első komplett utasszállító kapszulát.

Gyorsan fejlődik a szövegből generált képek szerkesztése

Sokat fejlődnek a szöveges utasítás alapján szöveget létrehozó modellek, látványosan egyre jobbak az outputok. Vajon a képgenerátorok hatékonyabb gyakoroltatásától – hogy tényleg a promptokat kövessék – is hasonló eredmény várható?

A Berkeley-i Kaliforniai Egyetem (UC Berkeley) kutatói által fejlesztett InstructPix2Pix módszerrel valószínűleg közelebb kerülünk a célhoz. Előzetesen gyakoroltatott szövegből képet generáló modellt képek újravizsgálására finomhangolnak vele. Egyszerű utasításokat használ, például „helyettesítsd banánnal a narancsot”. Még a kép narancsokat tartalmazó részét sem jelöli meg a promptban.

text_to_image.jpg

A módszer – értelemszerűen promptot nélkülöző – hagyományos és promptból generált képekkel egyaránt működik.

Ha képet és szerkesztési utasítást adunk egy tipikus előzetes tanuláson átment képgenerátornak, az eredmény tartalmazhatja az óhajtott elemeket, de valószínűleg másként néz ki, mint ahogy elképzeltük. Viszont úgy finomhangolhatjuk, hogy a promptot, a promptból generált képet, a prompt átszerkesztett változatát, az ahhoz kapcsolódó megváltoztatott képet és a változtatást leíró utasítást tartalmazó adatsort használva, utasításainkra tényleg megfelelő választ adjon.

text_to_image0.jpg

Többszáz vagy többezer kép annotálása nagyon költséges és fáradságos lehet, egy ilyen adatsor viszont szerencsére szintetizálható is. Képek és a promptoknak megfelelő leírások korpuszával kezdjük, majd egy előre gyakoroltatott nagy nyelvmodell átdolgozott promptokkal, végül a képgenerátor pedig átdolgozott lépekkel áll elő.

A kutatók a Stable Diffusiont finomhangolták, és a kép átdolgozására vonatkozó utasítást adtak neki. A finomhangoló adatsort a GPT-3 nagy nyelvmodell, maga a szövegből képet alkotó Stable Diffusion, és a kezdő prompt átdolgozott változatával generált képeket újfent átdolgozó Prompt-to-Prompt segítségével dolgozták ki.

Az InstructPix2Pix a teszteken kifejezetten jó eredményt ért el, és a képgenerálást is egyszerűbbé teszi. Meglévő modellek átgondolt használatával a kutatóknak, viszonylag kevés ember által címkézett példával dolgozva, új feladatra sikerült betanítaniuk a modelljüket.

A fegyvert észreveszi a biztonsági rendszer, a kést nem

Mesterségesintelligencia-rendszerektől ugyan elvárhatjuk, hogy időnként tökéletesen működjenek, a kritikus feladatokat végzőket, például a fegyvereket detektálókat viszont kiemelten kell figyelni. Eleve a gyártóknak sok és változatos tesztet kell végezni velük, máskülönben nem győződhetnek meg a hatékony működésükről. De még ez sem százszázalékos garancia.

A New York állambeli Utica Proctor gimnáziuma felbontotta az MI-vel működő fegyverdetektor-rendszereket gyártó Evolv Technologies-szal kötött szerződését. Az ok: az ellenőrzés ellenére, egy diák késsel ment be az iskolába. A rendszert tavaly installálták, 3,7 millió dollárt fizettek érte.

evolv0.jpg

A rendszer ultraalacsony frekvenciájú rádióérzékelőket használva pásztázza épületek bejáratánál az érkező személyeket. A szenzorokat oszlopokra rögzítik.

Az MI-modellt kb. ötvenezer szkent felhasználva tanították be tárgyak, köztük fegyverek, bombák és kések azonosítására, csoportosítására. Óránként 3600 személyt képes átvizsgálni, tízszer annyit, mint egy sima fémdetektor. Múzeumok, témaparkok, stadionok és iskolák tartoznak az Evolv Technologies ügyfelei közé.

2022. október 31-én egy diák vadászkést vitt be az oktatási intézménybe. A szkenner nem ismerte fel, A fiú később megtámadta egyik diáktársát, és súlyos sebesüléseket okozott neki a késsel.

A támadást követően a tanfelügyelőség belső vizsgálatot folytatott, és kiderült: a rendszer három alkalommal nem ismert fel késeket. Ezt követően hagyományos fémdetektorral helyettesítették.

A tankörzet tizenkét másik iskolájában viszont változatlanul az Evolv Technologies megoldását használják. Igazgatók elmondták, hogy túl drága lenne a lecserélés, helyettesítés.

Pedig figyelmeztető jel lehetett volna az USA Látványsportok Biztonsági és Biztonságossági Központjának 2021-es tesztje, amelyből kiderült, hogy az Evolv Technologies rendszere a fegyvereket száz százalékban, a késeket viszont csak negyvenkét százalékban azonosítja.

Grimes hangjának klónozására buzdítja rajongóit

Generatív audióeszközök, mint például a Murf.ai és a Respeecher a hangklónok áradatát indították el. Népszerű popsztárok másolatai énekelnek, változatos stílusokban szól a muzsika, és minden másolat. A világ zenei szerzőjogainak jelentős részét birtokló Universal Music Group (UMG) márciusban lépett is az üzleti tevékenységének ártó trend ellen, és streaming-szolgáltatókat, köztük a YouTube-ot és a Spotify-t is a mesterséges intelligenciával generált számok eltávolítására szólította fel.

Egyes szinkronhangok, hang-színészek már licencelik is a hangjukat, hogy MI-vel generált hasonmások használhassák fel.

grimes2.jpg

Az elektronikus és a popzene határmezsgyéjén alkotó, csúcstechnológiákhoz, transzhumanizmushoz erősen vonzódó, kísérletező kedvű kanadai Grimes – Elon Musk korábbi élettársa és két gyermekének édesanyja – egy lépéssel továbbmenve, kiadta a GrimesAI-1 generatív audióeszközt, amellyel bárki saját dalt, beszédet vehet fel az énekesnő klónozott hangjával. Május 24-ig több mint tizenötezer hanganyagot, köztük háromszáznál több teljes számot rögzítettek és töltöttek fel a felhasználók streaming-szolgáltatásokra.

grimes0.jpg

A GrimesAI-1 az alkotó és a művészmenedzsmenttel foglalkozó CreateSafe vállalat által közösen létrehozott elf.tech honlapon érhető el. A felhasználók meglévő hangfelvételeket töltenek fel, vagy az ottani alkalmazással vesznek fel újakat. A GrimesAI-1 az énekesnő nyers és effektusokkal, például reverbbel (utózengés, visszaverődés) felturbózott hangján egyaránt tanult.

grimes.jpg

A felhasználók az általuk kiválasztott audióalkalmazások segítségével háttérzenét adhatnak anyagaikhoz. Végül egy gombra kattintva, tölthetik fel alkotásukat streaming-szolgáltatásokra.

grimes1.jpg

Egy tweetben Grimes javasolta, hogy MI-hangklónjával keressenek pénzt, és a befolyó összegek felére tart igényt.

A mesterséges intelligencia által generált zeneutánzatokhoz úgy is lehet viszonyulni, mint az UMG, és úgy is, mint Grimes. A tiltással szemben mindenesetre kreatívabb és demokratikusabb a rajongókkal való együttműködés

Egyre többen és hangosabban követelik az MI szabályozását

A generatív MI folyamatos minőségjavulásával felerősödtek az aggódó hangok is. Az esetleges nagyon átgondolt szabályozással és az azt megerősítő mechanizmusokkal sokak szerint a mesterségesintelligencia-fejlesztések és az alkalmazások valóban közhasznúak lesznek. Az iparági szereplők számára viszont csak úgy van értelme a szabályozásnak, ha nagyon pontosan definiálják az irányvonalakat, mert így tudják elérni, hogy a modellek ne ártsanak a társadalomnak, és a vállalatok jó hírneve se csorbuljon. Súlyosabb jogi megszorításokkal kevesebben élvezhetnék az MI előnyeit, férhetnének a technológiához.

Nem véletlen, hogy az utóbbi hetekben technológiai vezetők és politikusok, döntéshozók rengeteget beszélnek az MI megregulázásáról, finomabban kifejezve: szabályozásáról.

g7_szabalyozas.jpg

Egyelőre Kína az egyetlen ország a világon, amely explicit szabályozta a generatív MI-t. Márciusban EU-s tisztviselők ugyan átírták az Unió erre vonatkozó törvényét, a módosítást viszont még nem fogadták el. A generatív modelleket „magas kockázatúként” osztályozza, bürokratikus felügyeletnek és rendszeres ellenőrzésnek vetné alá azokat.

A területen élenjáró OpenAI, a Microsoft és a Google vezetői szintén a szabályozás mellett érvelnek, vezető politikusokkal folytatnak magánbeszélgetéseket a témáról. Nemzeti kormányok új „védőkorlátokat” – legyenek akármik is azok – vezetnének be a mesterséges intelligenciával kapcsolatban.

Sam Altman, az OpenAI vezérigazgatója végigjárta a földkerekséget, és az új törvények, köztük az EU szabályozásának támogatásáról biztosított mindenkit. A szuperintelligenciát (amelytől nagyon messze vagyunk) felügyelő globális szabályozó testület felállítását javasolja. Májusban az amerikai kongresszus előtt szintén pozitívan beszélt a szabályozásról. Ugyanakkor azt is javasolta, hogy a startupokkal az új törvények ne legyenek olyan szigorúak, mint a vezető nagyvállalatokkal. Az OpenAI tíz, százezer dolláros ösztöndíjat ítél oda az MI irányítási kereteinek a kidolgozására, a jelentkezéseket június 24-ig bírálják el. Brad Smith, a Microsoft elnöke nagyjából ugyanazt mondta el, mint Altman, és amerikai szabályozó ügynökséget javasolt.

Sundar Pichai, a Google vezérigazgatója beleegyezett, hogy együttműködik európai döntéshozókkal az „MI-paktum”, a fejlesztőknek már az uniós szabályozás hatályba lépése előtt kötelezően betartandó szabálysor kidolgozásában.

A hirosimai G7 találkozón a generatív MI kockázatait vizsgáló kormányközi munkacsoportot jelentettek be. A tagok megfogadták, hogy egymással kompatibilis, demokratikus alapértékeket – korrektség, elszámoltathatóság, átláthatóság, biztonság, adatvédelem, visszaélések elleni fellépés, emberi jogok betartása – tükröző törvényeket dolgoznak ki az MI szabályozására.

Biden elnök stratégiai tervet tett közzé, amelyben az USA szabályozó szerveitől nyilvános adatsorok, viszonyítási alapok, szabványok kidolgozását kéri MI-rendszerek gyakoroltatásához, méréséhez, kiértékeléséhez.

Francia adatvédelmi szabályozók májusban a generatív MI szabályozására vonatkozó keretet jelentettek be.

Mélytanulás olcsó hardveren

A Kansas Egyetem kutatói pici önvezető autómodellt (DeepPicar Micro) kormányzó ideghálót fejlesztettek. A rádióvezérlésű járművet egyszerű pályán tesztelték. A projekt korábbi tevékenységük folytatása, amelyekben erősen korlátozott kapacitású hardverekhez építettek ideghálókat.

A modellt kontrolláló hálónak eleve elég kicsinek kell lennie ahhoz, hogy passzoljon a mikrokontrollerhez, ugyanakkor gyorsnak is az autó környezetének mozgás közbeni felismeréséhez, és pontosnak, hogy elkerülje az ütközéseket.

melytanulas_olcsohardver.jpg

Az ideghálót úgy kellett tervezni, hogy mindhárom kritériumnak megfeleljen. A méretet és a késleltetést figyelembe véve, többféle architektúrát dolgoztak ki, illetve mindezt a pontosság empirikus tesztelhetőségének szem előtt tartásával hozták létre.

A hardver 1:24-es kicsinyítésű NewBright autómodellből, akkumulátorból és motormeghajtóból, Raspberry Pi Pico mikrokontrollerből, Arducam Mini 2MP Plus kamerából állt. A modell a PilotNet konvolúciós ideghálón alapult, amelyhez a kutatók adatsort dolgoztak ki. Az adatsorhoz a köralakú pályán manuálisan vezették a járművet, amelyről tízezer fényképet készítettek.

melytanulas_olcsohardver0.jpg

A rendszer elméleti feldolgozó-kapacitását a kamera teljesítménye korlátozta, a hálózat következtetései késleltetését a 133 milliszekundumonként készülő képekhez igazították. Ötven különböző méretű ideghálót futtattak hozzá, és végül tizenhat modellt teszteltek.

A legjobb hét kört teljesített, heten egyetlenegyet sem. A legalább egy kört teljesítők nyolcvan százaléknál pontosabbak voltak, a késleltetés pedig nem érte el a száz milliszekundumot.

A projekt bizonyította, hogy mélytanulás-alkalmazások akkor is működhetnek, ha alacsony az elektromosáram-kapacitás, nem praktikus a számítási felhőben történő feldolgozás, és fontos az adatvédelem. Korlátozott teljesítményű hardveren, kevés számítási memória és szintén kevés áram mellett is futó, nagy teljesítményű algoritmusok kellenek hozzá. Kis modelleket jó eredményre begyakoroltatni nehezebb, mint nagyokat, de lehetséges, a különbség csökkentéséhez viszont új modellek kellenek.

Az alacsony költségen működtetett, gyenge hardveren futó ideghálók a környezetet, termést, távoli terepeket hatékonyan megfigyelő műszerekhez vezethetnek.

süti beállítások módosítása