Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Maximum háromórás szárazföldi utazás a kontinens egyik végpontjából a másikba

2023. június 09. - ferenck

A hyperloop technológia lényege, hogy utasszállító kapszulák villanymotor által hajtott, légritkított csőben haladnak. Megvalósulásával jelentősen felgyorsul majd a földi személy- és teherszállítás, a következő évtizedben az egymástól 350 kilométerre fekvő városok közötti távolság félóra alatt tehető meg. Igazából nem vasút, hanem a legjobb vonatokat és repülőket kombináló, teljesen új közlekedési eszköz.

Az eredeti ötlet, a Hyperloop Alpha Elon Musk cégéhez, a SpaceX-hez fűződik, 2013-ban ötvenhét oldalas tanulmányban mutatták be a technológiát. Musk szerint az új megoldás az ötödik önálló szállítási rendszer. (A közúti, a vasúti, a vízi és a légi közlekedés a másik négy.)

utazas.jpg

Andrés de León, a személy- és teherszállítással egyaránt foglalkozó kaliforniai Hyperloop Transportation Technologies vezérigazgatója szerint a technológiával az összes kontinentális távolság három óra alatt megtehető. 2026 és 2028 között válhat valósággá – emelte ki.

A hyperloop ma már kétmilliárd dolláros globális piac, az előrejelzések szerint 2040-re 800 milliárdos, 2050-re kétbilliós lesz. Egyre több a projekt, a lineáris motort, lebegő rendszert és aerodinamikus meghajtást egybekombináló spanyol Zeleros például már ezer km/h sebességben, fenntartható mobilitásban gondolkozik. A rendszer skálázhatóságán és más piacokon való alkalmazási lehetőségein is dolgoznak, többek között szállítmányok kikötőbeli mozgásának „széntelenítésére” is a hyperloopban látják a megoldást. (A tetőn lévő napelemek öt-tizenöt százalékkal több energiát generálnak, mint amennyit a rendszer fogyaszt.)

A fenntarthatósági elvek betartása egyébként is – szinte minden területen – az elsőszámú szempontok közé tartozik. Nem véletlenül, mert a közlekedés a globális széndioxid-kibocsátás huszonhárom százalékáért felelős, az általa okozott szennyezés költsége 54,1 billiárd dollár.

A környezetbarát szempontok érvényesítése („nettó zéró szén rendszer”) mellett a hyperloop másik nagy előnye a biztonság. A technológia folyamatos monitoring-tevékenységet végző, a kapszulába épített, biztonságos passzív mágneses lebegést garantáló intelligens szenzorokkal működik. A tervek szerint mindezek mellett költséghatékony és kényelmes utazási mód.

A Hyperloop Transportation Technologies hozta létre (a dél-franciaországi Toulouse-ban) az első teljes, négy méter átmérőjű hyperloop-tesztrendszert és az első komplett utasszállító kapszulát.

Gyorsan fejlődik a szövegből generált képek szerkesztése

Sokat fejlődnek a szöveges utasítás alapján szöveget létrehozó modellek, látványosan egyre jobbak az outputok. Vajon a képgenerátorok hatékonyabb gyakoroltatásától – hogy tényleg a promptokat kövessék – is hasonló eredmény várható?

A Berkeley-i Kaliforniai Egyetem (UC Berkeley) kutatói által fejlesztett InstructPix2Pix módszerrel valószínűleg közelebb kerülünk a célhoz. Előzetesen gyakoroltatott szövegből képet generáló modellt képek újravizsgálására finomhangolnak vele. Egyszerű utasításokat használ, például „helyettesítsd banánnal a narancsot”. Még a kép narancsokat tartalmazó részét sem jelöli meg a promptban.

text_to_image.jpg

A módszer – értelemszerűen promptot nélkülöző – hagyományos és promptból generált képekkel egyaránt működik.

Ha képet és szerkesztési utasítást adunk egy tipikus előzetes tanuláson átment képgenerátornak, az eredmény tartalmazhatja az óhajtott elemeket, de valószínűleg másként néz ki, mint ahogy elképzeltük. Viszont úgy finomhangolhatjuk, hogy a promptot, a promptból generált képet, a prompt átszerkesztett változatát, az ahhoz kapcsolódó megváltoztatott képet és a változtatást leíró utasítást tartalmazó adatsort használva, utasításainkra tényleg megfelelő választ adjon.

text_to_image0.jpg

Többszáz vagy többezer kép annotálása nagyon költséges és fáradságos lehet, egy ilyen adatsor viszont szerencsére szintetizálható is. Képek és a promptoknak megfelelő leírások korpuszával kezdjük, majd egy előre gyakoroltatott nagy nyelvmodell átdolgozott promptokkal, végül a képgenerátor pedig átdolgozott lépekkel áll elő.

A kutatók a Stable Diffusiont finomhangolták, és a kép átdolgozására vonatkozó utasítást adtak neki. A finomhangoló adatsort a GPT-3 nagy nyelvmodell, maga a szövegből képet alkotó Stable Diffusion, és a kezdő prompt átdolgozott változatával generált képeket újfent átdolgozó Prompt-to-Prompt segítségével dolgozták ki.

Az InstructPix2Pix a teszteken kifejezetten jó eredményt ért el, és a képgenerálást is egyszerűbbé teszi. Meglévő modellek átgondolt használatával a kutatóknak, viszonylag kevés ember által címkézett példával dolgozva, új feladatra sikerült betanítaniuk a modelljüket.

A fegyvert észreveszi a biztonsági rendszer, a kést nem

Mesterségesintelligencia-rendszerektől ugyan elvárhatjuk, hogy időnként tökéletesen működjenek, a kritikus feladatokat végzőket, például a fegyvereket detektálókat viszont kiemelten kell figyelni. Eleve a gyártóknak sok és változatos tesztet kell végezni velük, máskülönben nem győződhetnek meg a hatékony működésükről. De még ez sem százszázalékos garancia.

A New York állambeli Utica Proctor gimnáziuma felbontotta az MI-vel működő fegyverdetektor-rendszereket gyártó Evolv Technologies-szal kötött szerződését. Az ok: az ellenőrzés ellenére, egy diák késsel ment be az iskolába. A rendszert tavaly installálták, 3,7 millió dollárt fizettek érte.

evolv0.jpg

A rendszer ultraalacsony frekvenciájú rádióérzékelőket használva pásztázza épületek bejáratánál az érkező személyeket. A szenzorokat oszlopokra rögzítik.

Az MI-modellt kb. ötvenezer szkent felhasználva tanították be tárgyak, köztük fegyverek, bombák és kések azonosítására, csoportosítására. Óránként 3600 személyt képes átvizsgálni, tízszer annyit, mint egy sima fémdetektor. Múzeumok, témaparkok, stadionok és iskolák tartoznak az Evolv Technologies ügyfelei közé.

2022. október 31-én egy diák vadászkést vitt be az oktatási intézménybe. A szkenner nem ismerte fel, A fiú később megtámadta egyik diáktársát, és súlyos sebesüléseket okozott neki a késsel.

A támadást követően a tanfelügyelőség belső vizsgálatot folytatott, és kiderült: a rendszer három alkalommal nem ismert fel késeket. Ezt követően hagyományos fémdetektorral helyettesítették.

A tankörzet tizenkét másik iskolájában viszont változatlanul az Evolv Technologies megoldását használják. Igazgatók elmondták, hogy túl drága lenne a lecserélés, helyettesítés.

Pedig figyelmeztető jel lehetett volna az USA Látványsportok Biztonsági és Biztonságossági Központjának 2021-es tesztje, amelyből kiderült, hogy az Evolv Technologies rendszere a fegyvereket száz százalékban, a késeket viszont csak negyvenkét százalékban azonosítja.

Grimes hangjának klónozására buzdítja rajongóit

Generatív audióeszközök, mint például a Murf.ai és a Respeecher a hangklónok áradatát indították el. Népszerű popsztárok másolatai énekelnek, változatos stílusokban szól a muzsika, és minden másolat. A világ zenei szerzőjogainak jelentős részét birtokló Universal Music Group (UMG) márciusban lépett is az üzleti tevékenységének ártó trend ellen, és streaming-szolgáltatókat, köztük a YouTube-ot és a Spotify-t is a mesterséges intelligenciával generált számok eltávolítására szólította fel.

Egyes szinkronhangok, hang-színészek már licencelik is a hangjukat, hogy MI-vel generált hasonmások használhassák fel.

grimes2.jpg

Az elektronikus és a popzene határmezsgyéjén alkotó, csúcstechnológiákhoz, transzhumanizmushoz erősen vonzódó, kísérletező kedvű kanadai Grimes – Elon Musk korábbi élettársa és két gyermekének édesanyja – egy lépéssel továbbmenve, kiadta a GrimesAI-1 generatív audióeszközt, amellyel bárki saját dalt, beszédet vehet fel az énekesnő klónozott hangjával. Május 24-ig több mint tizenötezer hanganyagot, köztük háromszáznál több teljes számot rögzítettek és töltöttek fel a felhasználók streaming-szolgáltatásokra.

grimes0.jpg

A GrimesAI-1 az alkotó és a művészmenedzsmenttel foglalkozó CreateSafe vállalat által közösen létrehozott elf.tech honlapon érhető el. A felhasználók meglévő hangfelvételeket töltenek fel, vagy az ottani alkalmazással vesznek fel újakat. A GrimesAI-1 az énekesnő nyers és effektusokkal, például reverbbel (utózengés, visszaverődés) felturbózott hangján egyaránt tanult.

grimes.jpg

A felhasználók az általuk kiválasztott audióalkalmazások segítségével háttérzenét adhatnak anyagaikhoz. Végül egy gombra kattintva, tölthetik fel alkotásukat streaming-szolgáltatásokra.

grimes1.jpg

Egy tweetben Grimes javasolta, hogy MI-hangklónjával keressenek pénzt, és a befolyó összegek felére tart igényt.

A mesterséges intelligencia által generált zeneutánzatokhoz úgy is lehet viszonyulni, mint az UMG, és úgy is, mint Grimes. A tiltással szemben mindenesetre kreatívabb és demokratikusabb a rajongókkal való együttműködés

Egyre többen és hangosabban követelik az MI szabályozását

A generatív MI folyamatos minőségjavulásával felerősödtek az aggódó hangok is. Az esetleges nagyon átgondolt szabályozással és az azt megerősítő mechanizmusokkal sokak szerint a mesterségesintelligencia-fejlesztések és az alkalmazások valóban közhasznúak lesznek. Az iparági szereplők számára viszont csak úgy van értelme a szabályozásnak, ha nagyon pontosan definiálják az irányvonalakat, mert így tudják elérni, hogy a modellek ne ártsanak a társadalomnak, és a vállalatok jó hírneve se csorbuljon. Súlyosabb jogi megszorításokkal kevesebben élvezhetnék az MI előnyeit, férhetnének a technológiához.

Nem véletlen, hogy az utóbbi hetekben technológiai vezetők és politikusok, döntéshozók rengeteget beszélnek az MI megregulázásáról, finomabban kifejezve: szabályozásáról.

g7_szabalyozas.jpg

Egyelőre Kína az egyetlen ország a világon, amely explicit szabályozta a generatív MI-t. Márciusban EU-s tisztviselők ugyan átírták az Unió erre vonatkozó törvényét, a módosítást viszont még nem fogadták el. A generatív modelleket „magas kockázatúként” osztályozza, bürokratikus felügyeletnek és rendszeres ellenőrzésnek vetné alá azokat.

A területen élenjáró OpenAI, a Microsoft és a Google vezetői szintén a szabályozás mellett érvelnek, vezető politikusokkal folytatnak magánbeszélgetéseket a témáról. Nemzeti kormányok új „védőkorlátokat” – legyenek akármik is azok – vezetnének be a mesterséges intelligenciával kapcsolatban.

Sam Altman, az OpenAI vezérigazgatója végigjárta a földkerekséget, és az új törvények, köztük az EU szabályozásának támogatásáról biztosított mindenkit. A szuperintelligenciát (amelytől nagyon messze vagyunk) felügyelő globális szabályozó testület felállítását javasolja. Májusban az amerikai kongresszus előtt szintén pozitívan beszélt a szabályozásról. Ugyanakkor azt is javasolta, hogy a startupokkal az új törvények ne legyenek olyan szigorúak, mint a vezető nagyvállalatokkal. Az OpenAI tíz, százezer dolláros ösztöndíjat ítél oda az MI irányítási kereteinek a kidolgozására, a jelentkezéseket június 24-ig bírálják el. Brad Smith, a Microsoft elnöke nagyjából ugyanazt mondta el, mint Altman, és amerikai szabályozó ügynökséget javasolt.

Sundar Pichai, a Google vezérigazgatója beleegyezett, hogy együttműködik európai döntéshozókkal az „MI-paktum”, a fejlesztőknek már az uniós szabályozás hatályba lépése előtt kötelezően betartandó szabálysor kidolgozásában.

A hirosimai G7 találkozón a generatív MI kockázatait vizsgáló kormányközi munkacsoportot jelentettek be. A tagok megfogadták, hogy egymással kompatibilis, demokratikus alapértékeket – korrektség, elszámoltathatóság, átláthatóság, biztonság, adatvédelem, visszaélések elleni fellépés, emberi jogok betartása – tükröző törvényeket dolgoznak ki az MI szabályozására.

Biden elnök stratégiai tervet tett közzé, amelyben az USA szabályozó szerveitől nyilvános adatsorok, viszonyítási alapok, szabványok kidolgozását kéri MI-rendszerek gyakoroltatásához, méréséhez, kiértékeléséhez.

Francia adatvédelmi szabályozók májusban a generatív MI szabályozására vonatkozó keretet jelentettek be.

Mélytanulás olcsó hardveren

A Kansas Egyetem kutatói pici önvezető autómodellt (DeepPicar Micro) kormányzó ideghálót fejlesztettek. A rádióvezérlésű járművet egyszerű pályán tesztelték. A projekt korábbi tevékenységük folytatása, amelyekben erősen korlátozott kapacitású hardverekhez építettek ideghálókat.

A modellt kontrolláló hálónak eleve elég kicsinek kell lennie ahhoz, hogy passzoljon a mikrokontrollerhez, ugyanakkor gyorsnak is az autó környezetének mozgás közbeni felismeréséhez, és pontosnak, hogy elkerülje az ütközéseket.

melytanulas_olcsohardver.jpg

Az ideghálót úgy kellett tervezni, hogy mindhárom kritériumnak megfeleljen. A méretet és a késleltetést figyelembe véve, többféle architektúrát dolgoztak ki, illetve mindezt a pontosság empirikus tesztelhetőségének szem előtt tartásával hozták létre.

A hardver 1:24-es kicsinyítésű NewBright autómodellből, akkumulátorból és motormeghajtóból, Raspberry Pi Pico mikrokontrollerből, Arducam Mini 2MP Plus kamerából állt. A modell a PilotNet konvolúciós ideghálón alapult, amelyhez a kutatók adatsort dolgoztak ki. Az adatsorhoz a köralakú pályán manuálisan vezették a járművet, amelyről tízezer fényképet készítettek.

melytanulas_olcsohardver0.jpg

A rendszer elméleti feldolgozó-kapacitását a kamera teljesítménye korlátozta, a hálózat következtetései késleltetését a 133 milliszekundumonként készülő képekhez igazították. Ötven különböző méretű ideghálót futtattak hozzá, és végül tizenhat modellt teszteltek.

A legjobb hét kört teljesített, heten egyetlenegyet sem. A legalább egy kört teljesítők nyolcvan százaléknál pontosabbak voltak, a késleltetés pedig nem érte el a száz milliszekundumot.

A projekt bizonyította, hogy mélytanulás-alkalmazások akkor is működhetnek, ha alacsony az elektromosáram-kapacitás, nem praktikus a számítási felhőben történő feldolgozás, és fontos az adatvédelem. Korlátozott teljesítményű hardveren, kevés számítási memória és szintén kevés áram mellett is futó, nagy teljesítményű algoritmusok kellenek hozzá. Kis modelleket jó eredményre begyakoroltatni nehezebb, mint nagyokat, de lehetséges, a különbség csökkentéséhez viszont új modellek kellenek.

Az alacsony költségen működtetett, gyenge hardveren futó ideghálók a környezetet, termést, távoli terepeket hatékonyan megfigyelő műszerekhez vezethetnek.

Mesterséges intelligencia az építészetben

A szövegből képet generáló modellek, a DALL-E 2, a Midjourney és a Stable Diffusion fontos szerepet játszanak a jelen és még inkább a közeljövő építészetében. A nemrég megtartott „MI és a tervezés jövője” kerekasztal-beszélgetésen Patrick Schumacher, a Zaha Hadid Architects főépítésze elmondta, hogyan használják a mesterséges intelligenciát külsőkre és belsőkre vonatkozó elképzelések megvalósításához.

Schumacher generatív modellekkel létrehozott képeket, hongkongi sokemeletes komplexum és Neom, egy szaúdi okos város alapjait, két fejlesztési stádiumban lévő projektet mutatott be.

epiteszet.jpg

A cég a modell outputjainak tíz-tizenöt százalékát nyers ötletként használja, amelyekből 3D művészek hagyományos módszerekkel dolgozzák ki külső és belső terek modelljeit. A szöveges utasítások (promptok) között gyakran szerepel az alapító Zaha Hadid (1950-2016) neve, görbe vonalai, utalás jellegzetes stílusára. A beállítást, környezetet stb. szintén megadják a promptokban. A modelleket a számítási felhőbe teszik, de a közeljövőben ez meg fog változni, mert házon belüli adatközpontot terveznek használni erre a célra.

epiteszet0.jpg

A szövegből képet generáló modellek más tervezőművészetekben is terjednek. A kerekasztal-beszélgetés egyik résztvevője, Refik Anadol például vizuális installációihoz, MI által készített képek immerzív vetítéséhez használja a technológiát. Ross Loveggrove ipari tervező a Midjourney és a DALL-E 2 közreműködésével dolgoz ki autó-, bútor- és más terveket.

epiteszet1.jpg

Áprilisban, New Yorkban rendezték meg az első MI Divathetet. Több mint 350 tervező kollekcióját mutatták be, munkáikhoz mindegyik használt valamilyen generatív modellt.

epiteszet2.jpg

A Zaha Hadid Architects olimpiai falukon, nemzetközi repülőtér-terminálokon, felhőkarcolókon, kulturális központokon és számos más létesítményen dolgozott eddig. Nekik köszönhetően, a jövőben sokmillióan ismerhetnek majd meg mesterséges intelligencia által elképzelt épületeket, amelyek nemcsak önmagukban lesznek mutatósak, hanem az ember-gép együttműködés legszebb példái közé is tartozhatnak.

A modellek, az építészek múltbeli terveiből tanulva, segítenek a jövő környezeteinek kialakításában.

Százezer qubites kvantumszámítógépet akar építeni az IBM

Az IBM tavaly az eddigi csúcsnak számító 433 kvantumbitet (qubitet) tartalmazó processzoros kvantumszámítási rendszert fejlesztett. Május 22-én, a hirosimai G7-csúcson a nagyvállalat bejelentette, hogy tíz éven belül százezer qubites számítógépet akar építeni. A cél nagyságrendekkel ambiciózusabb a 433-nál.

A fejlesztésben a Tokió Egyetem és a Chicago Egyetem is részt vesz, a kezdeti befektetés százezer dollár, a cél pedig a rendszer teljeskörű működése, szuperszámítógépekkel megoldhatatlan problémák abszolválása. Az IBM úgy képzeli el, hogy a százezer qubites szerkezet „klasszikus” szuperszámítógépek mellett dolgozna a gyógyszerkutatástól elemek teljesítményének növeléséig ívelő alkalmazásokban. Kvantumközpontú szuperszámításokról beszélnek.

kvantum_12.jpg

Kvantumszámítógépek eddig semmi olyat nem oldottak meg, amire szabvány szuperkomputerek ne lennének képesek. A qubitek alacsony száma és a környezet apró zavaró hatásai, a „zaj” a két legfontosabb hátráltató tényező.

Kutatók évek óta keresnek megoldásokat a zajos rendszerekre, viszont sokuk szerint csak szignifikáns mértékű „felméretezésükkel” orvosolható a probléma, azaz rengeteg qubit végezne hibakorrekciót.

Az IBM nincs egyedül nagyratörő terveivel. A Google egymillió qubitet szeretne elérni az évtized végére, hibakorrekcióval viszont olyan sok foglalkozna, hogy tényleges számításokra „csak” kb. tízezer maradna. A Palo Altoi PsiQuantum szintén egymillióban gondolkozik, de céldátumot nem jelöltek meg. A marylandi IonQ 1024 logikai qubites rendszerét 2028-ig valósítaná meg.

A számok azért csalókák, mert nem tudjuk, hogyan építik a rendszereket, mennyire állnak ellen a zajnak, milyen teljesítményre képesek a qubitek, és a típusaikat is meg kell különböztetni egymástól. Mindezek a tényezők megnehezítik a verseny követését.

Az IBM szerint mostani technológiákkal maximum ötezer qubites rendszer építhető, tehát új megoldásokra lesz szükség. A qubitek hatékony működtetésére szintén ki kell találni valamilyen energiatakarékos módszert. A sikerhez több felsőoktatási intézményt is be kell vonni a kutatásokba, szerencsére az IBM és a Google is gőzerővel dolgozik ezen. Több szakember is kellene, és a kvantumszámítógépeket működtető szoftverek szintén kulcsfontosságúak.

Új uniós szabályozó szervezet tanulmányozza az algoritmusokat

Az Európai Unió vezető szerepet játszik a mesterséges intelligencia szabályozásában. Sok nemzeti szintű próbálkozás mellett, az EU a közösségi médiát meghatározó algoritmusok vizsgálatával, az európai határokon túl is csökkentheti a károkat, segítheti a felhasználókat.

Az uniós szabályozók célkeresztjében egyértelműen a mesterséges intelligencia áll. 2021 óta dolgoznak az automatizált rendszerek által okozott potenciális károkra vonatkozó szabálysorokból álló, év végére várható MI Törvényen. Április tizenharmadikán az Európai Adatvédelmi Testület több ország az OpenAI ChatGPT-jének esetleges személyiségjogokat sértő tevékenységének vizsgálatát koordináló munkacsoportot hozott létre.

blackbox_ai0.jpg

Az új munkacsoport, az Algoritmikus Átláthatóság Európai Központja (ECAT) a közösségimédia-oldalakon az információt azonosító, kategorizáló, rangsoroló algoritmusokat és a keresőmotorokat fogja tanulmányozni.

Az ECAT jogában áll eldönteni, hogy melyik MI- és más algoritmus felel meg az Unió digitális szolgáltatásokról szóló törvényének, blokkolja az online gyűlöletbeszédet, egyes célzott hirdetéstípusokat és más megkérdőjelezhető tartalmakat. A szervezet még nem állt fel teljesen, harminc-negyven alkalmazottal, köztük mesterségesintelligencia-szakértőkkel fog dolgozni.

blackbox_ai.jpg

Feladatai három főkategóriába sorolhatók.

A kivizsgálás célja az úgynevezett „fekete doboz” algoritmusok működésének kiértékelése. A vállalatoktól európai szabályozók által törvényesen kért beszámolókat és auditokat elemez. Eljárásokat dolgoz ki független kutatók és szabályozók számára, hogy hozzáférjenek az algoritmusokra vonatkozó adatokhoz.

A szervezet működésének másik pillére a kutatás lesz. Az ajánlóalgoritmusok illegális tartalmakat terjesztő, emberi jogokat, demokratikus folyamatokat sértő, a felhasználók egészségét károsító potenciálját tervezik vizsgálni. Kiértékelik a kockázatokat csökkentő intézkedéseket, illetve új kockázatokat azonosítanak. Az algoritmusok hosszútávú hatásait szintén tanulmányozzák, és módszereket dolgoznak ki a mostaninál könnyebben megvalósítható felelősségre vonásukra, nagyobb átláthatóságukra.

A közösségépítés a harmadik pillér. A szervezet az oktatási-akadémiai intézmények, ipari szereplők, közszolgálat és NGO-k közötti információmegosztás csomópontjaként (hub) is kíván funkcionálni.

Rendet rak a lakásban, és a mosásban is segít egy új robot

Több egyetem (Princeton, Colombia stb.) szakembereiből álló kutatócsoport rendrakásra és a mosás előkészítésére is használható robotot fejlesztett. A TidyBot nevű szerkezet valóban takarosnak tűnik, mert speciális utasítások alapján összeszedi és a helyükre teszi a padlón heverő tárgyakat.

Utasításokat tartalmazó szövegalapú adatsorral kezdték, majd nagy nyelvmodellekkel, főként a GPT-3-mal tesztelték a parancsokat, például, hogy hova kell tenni a világos és a sötét pólókat stb.

takarito_moso_robot.jpg

Huszonnégy forgatókönyvet dolgoztak ki négy helyiségre, mindegyikben kettő-öt helyre lehetett rakni a tárgyakat. A modelleket annyiban segítették, hogy a tárgyakat látottként vagy nem látottként írták le. A megközelítés sikerét a jó helyre tett tárgyak száma is meghatározta. A nyelvi modellekkel végzett munka eredményeként általános szabályt dolgoztak ki arra vonatkozóan, hogy egy speciális felhasználó számára hova tartoznak a tárgyak.

A stratégiát mosásra is alkalmazták, majd megállapították, hogy nyelvmodellek jól passzolnak a személyi robotokra vonatkozó általános követelményekhez. A robot az összes forgatókönyv 91.2 százalékában pontosan járt el a nem látott tárgyakkal, míg a való világban 85 százalékot ért el.

Mielőtt TidyBot elkezdi a munkát, a felhasználónak példával kell szemléltetnie speciális tárgyak elhelyezését. Ezt követően a nyelvmodellek foglalják össze a feladatokat. Utána a robot egyesével felszedi, azonosítja, és a helyükre teszi a tárgyakat. A cselekvéssort mindaddig ismétli, amíg az utolsóval is végez. Mosáshoz a szennyes-tartóba rakja a ruhákat, de a szeméttel is elboldogul, válogatás után vagy a hulladék-, vagy az újrahasznosítandókat tartalmazó kukába teszi a tárgyakat.

A közeljövőben a fejlesztők azon dolgoznak, hogy TidyBot minden egyes felhasználó személyes igényei szerint végezze munkáját, mert például a pólókat nem mindenki tartja ugyanott. A rendszernek néhány személyes interakción keresztül kell megtanulnia különféle felhasználók preferenciáit. A nyelvalapú tanulás és érzékelés sokat segít ezek felderítésében.

süti beállítások módosítása