Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Olcsóbb nyelvmodell alternatívákat kínál az OpenAI

2025. május 09. - ferenck

Az OpenAI 2024 végén vezette be az o1-et, az első megerősítéses tanulással gondolatláncok generálására gyakoroltatott, kereskedelmi célú nyelvmodellt. Néhány hónapon belül az Anthropic, a Google és a kínai DeepSeek szintén előállt saját következtetőmodellekkel. Az OpenAI ezt követően ígéretet tett általános rendeltetésű GPT sorozatmodelljei és az o-sorozat következtető modelljeinek integrálására, ami egyelőre nem történt meg.

A Sam Altman nevével fémjelzett nagyvállalat most öt új modellt vezetett be. Mindegyik elfogad szöveges és képi bemenetet, amelyekből szöveges kimenetet generál. Az általános rendeltetésű GPT-4.1, GPT-4.1 mini és GPT-4.1 nano csak API-n (alkalmazásprogramozói felület) keresztül, míg a másik kettő, a következtető o.3 és o.4-mini API-n és a ChatGPT Plus, Pro és Team, valamint hamarosan a ChatGPT Enterprise és Education felhasználói számára is elérhető lesz.

openai_9.jpg

Ezzel egyidőben a februárban kutatási előzetesként bemutatott GPT-4.5 júliusi leállítását is bejelentették. A nagyléptékű kísérletből kiderült, hogy a paraméterszám és a gyakorlóadat-mennyiség további növelése ugyan folyamatos teljesítménynövekedést eredményez, de a tokenenkénti költség alapján a használat egyáltalán nem tűnt praktikusnak.

Az új modellek alacsonyabb áron nyújtanak szintén kiváló teljesítményt.

A 4.1 család a 4.5 és a 4o költséghatékony megfelelői. Maximum egymillió token input lehetséges velük, ami komoly különbség a 4.5 és a 4o 128 ezréhez képest. A 4.1 ára két és nyolc, a minié 0,40 és 1,60, a nanoé 0,10 és 0,40 dollár között variálódik (egymillió token inputonként). A teljesítmény mind a 4.1, mind a mini esetében szinte mindenben jobb a 4o-énál,

Az o3 és az o4-mini az o1 és az o3-mini frissített változatai. Input korlátaik 200 ezer token, alacsony, közepes és magas-módban dolgoznak fel a felhasználó által nem látott, változatos számú következtető tokeneket. Elődeikkel ellentétben arra finomhangolták őket, hogy eldöntsék, mikor és hogyan használják a webes keresést, kódgenerálást és megvalósítást, képeditálást. Az árak tíz és negyven, illetve 1,10 és 4,40 dollár között variálódnak (egymillió input/output tokenenként).

Első OpenAI következtető-modellekként a gondolatláncot képekre is tudják alkalmazni. Például feltöltünk egy diagramot interpretációs utasításokkal, a modell pedig gondolatlánccal dolgozza fel. Az o3 teljesítménye a legtöbb kategóriában a mai csúcsminőség, és az o4-mini is jó eredményeket ért el a teszteken.

A kriptovaluták hívei bitcoin-beszerzést javasolnak a Svájci Jegybanknak

A kriptovaluták mellett kampányolók bitcoin-vásárlásra hívták fel a Svájci Jegybank figyelmét. A Donald Trump amerikai elnök követhetetlen vámháborúja miatti globális felfordulásban a szokásosnál is nagyobb szükség van a tartalékok diverzifikálására – magyarázzák.

A kriptovaluták támogatói már decemberben kampányt indítottak a svájci alkotmány megváltoztatásáért, hogy az írja elő: a jegybank az arany mellett bitcoint is tartson tartalékban. Bitcoin tartása logikusabb, mivel a világ többpólusúvá válik, amelyben a dollár és az euró egyaránt gyengül – hangzott már akkor a kriptovaluta-bróker Bitcoin Suisse egyik vezetőségi tagja, Luzius Meisser érvelése.

svajci_kozponti_bank.jpg

Bitcoin vásárlásával a jegybank megszabadulna a külföldi devizatartalékokat érintő politikai befolyástól. Komoly összegről van szó, mert a tartalékok háromnegyede dollár és euró - folytatta. 

Meisser a Svájci Jegybank éves nagytalálkozóján is felszólalt.

„Politikusok végül engedhetnek a pénznyomtatás kísértésének, hogy finanszírozzák terveiket. A bitcoin viszont hiányköltésekkel nem inflálható fizetőeszköz” – hangzott egy másik érve.

svajci_kozponti_bank0.jpg

Svájc a bitcoin- és a kriptovilág innovációjának központja, például az Ethereumot is az ottani Zug városában találták ki. A települést nem véletlenül hívják mostanában „Kripto Völgynek.” A Luzerni Alkalmazott Tudományok és Művészetek Egyetemének friss tanulmánya pedig kimutatta, hogy a lakosság tizenegy százaléka invesztált kriptoeszközökbe,

A jegybank azonban továbbra is szkeptikus. Nagy árfolyam-ingadozásokra, likviditási aggályokra és biztonsági kockázatokra hivatkoznak. Nem is rendelkeznek bitcoinnal.

„A kriptovaluták alapvetően szoftverek, és mind tudjuk: a szoftverek sebezhetők és gyakran tartalmazhatnak hibákat” – mondta Martin Schlegel jegybankelnök.

A Bitcoin Initiative szerint viszont a bitcoin mögötti, folyamatosan fejlődő technológia a valaha volt egyik legmegbízhatóbb és legbiztonságosabb informatikai rendszer.

Közel kétbillió dolláros kapitalizációjával a globális bitcoinpiac a leglikvidebb és legstabilabb digitális eszközök egyike, napi többmilliárd dolláros kereskedéssel. A Bitcoin Suisse és más szervezetek nem azt szeretnék, hogy a jegybank teljesen álljon át bitcoinra, viszont a közel egybillió svájci franknyi tartalék egy-két százalékát megérné egy értékében növekvő, egyre biztonságosabbá váló és szinte mindenki számára vonzó eszközre váltani – javasolják.

Mennyire segíti a mesterséges intelligencia a kódírást?

A világhírű gépitanulás-szakértő Andrew Ng sokkal jobban ért a Pythonhoz, mint a JavaScripthez, viszont az utóbbi időben több JavaScript-kódot írt mesterséges intelligencia (MI) támogatásával.

Mit jelent ez?

Azt, hogy az MI-vel támogatott kódírással (AI-assisted coding) a speciális programozási nyelvek veszítenek jelentőségükből. Persze fontos elsajátítani valamelyiket, mert így tanulják meg kulcsfogalmakat, és fejlesztőknek is komoly segítség jól ismert nyelvvel dolgozni, ugyanakkor az MI-vel jelentősen bővülnek a lehetőségek, többen valósíthatják meg kreatív (programozói) elképzeléseiket.

mi_kodiras.jpg

Ng háttere a gépi tanulás és a weboldalak, szoftveralkalmazások felhasználók által soha nem látott elemeinek tervezése és módosítása, a back-endfejlesztés. Az MI-vel támogatott kódolással viszont kevésbé ismert nyelvekkel is könnyedén épít a weboldalak és appok felhasználói interakciók tárgyát képező részét, front-end rendszereket is. 

A generatív MI-vel a szintaxis kevésbé fontos, így egy mérnök szimultán lehet Python-, JavaScript-, TypeScript-, C++-, Java-, sőt, még Conol-fejlesztő is. Idővel talán már nem is Python- vagy C++-fejlesztőkről, hanem egyszerűen csak fejlesztőkről beszélünk.

A különféle nyelvek mögötti fogalmak, elvek megértése viszont változatlanul fontos marad. Ng ezért hangsúlyozza egy nyelv megtanulásának jelentőségét. Ha ismerjük például a Pythont, jó alapunk van nagy nyelvmodellek (LLM-ek) promptolásához, hogy Pythonban vagy más nyelveken generáljanak kódokat nekünk. Ha tisztában vagyunk valamelyest ezekkel az elvekkel, és az egyik programozási nyelvről egy hasonló feladatokat más szintaxissal megoldó másikra váltunk, jobban elboldogulunk, és a generált kódot is jobban fogjuk érteni. Ha kevesebbet tudunk róluk, kevésbé leszünk hatékonyak az LLM-mel történő kódiratásban. Ha például egy Python-fejlesztő JavaScriptes front-endprogramozásra vált, sokat profitálhat az ilyen rendszerek mögötti elvek megtanulásából. Pontosabban promptolja az LLM-et, jobban kezeli az esetleges hibákat.

Tanulság? Ahogy a több nyelven folyékonyan beszélő emberek is könnyebben kommunikálnak másokkal, úgy fejlesztők számára az LLM-ek is leegyszerűsítik a különböző környezetekben történő rendszerépítést.

Nyílt forrású robotot mutatott be a Hugging Face

A nyíltforrású mesterségesintelligencia-modelleket kínáló, New Yorki székhelyű francia-amerikai Hugging Face szintet lépett a francia Pollen Robotics felvásárlásával. A Pollen Reachy 2 robotjának kódja Apache 2.0 licenc alatt ingyen szerezhető be, maga a gép pedig 70 ezer dollárba kerül.

Az opcionális kerekes alapon álló robot két karral, markoló-kezekkel rendelkezik. Elsődleges rendeltetése az oktatási alkalmazások, valamint ember-robot interakciók tanulmányozása valódi környezetekben.

hugging_face_robot0.jpg

Pythonban programozható, a Hugging Face LeRobot könyvtárának modelljeit futtatja. A vezérlőszoftvert helyben futtatja egy AMD processzoron alapuló PC-n, míg a mesterségesintelligencia-feldolgozás a számítási felhőben vagy helyi szerveren történik.

A robot virtuálisvalóság-kontrollerekre (Meta Quest 2 és 3) és a Pollen VR appjára reagál. Két kamerával felszerelt feje észleli, rögzíti a gyorsan változó környezetet, a távolságokat optikai szenzor méri. Az antennáin lévő mikrofonok hangokat vesznek fel, torzója mélykamerával észleli a távolságokat. Az alap a navigációban segítő Lidar érzékelőt is tartalmaz.

hugging_face_robot.jpg

A test nyakban és csuklóban 3D-s, a vállakon és könyökben 2D-s ízületekkel rendelkezik. Mindkét karja maximum három kiló tömegű tárgyakat képes felemelni. Tíz óra hosszat működő, újratölthető, huszonnégy voltos akkumulátor üzemelteti.

A Hugging Face robotikai lépése nem előzmények nélküli. A korábban a Tesla Optimusán dolgozó Remi Cadene tavaly csatlakozott a céghez, robotika projektjeiket ő vezeti. 2024 májusában mutatták be az előre programozott modelleket, adatkészleteket, megerősítéses és imitációs tanuláshoz használható szimulátorokat kínáló, nyíltforrású LeRobot kódkönyvtárat. Novemberben az Nvidia bejelentette, hogy a LeRobot adatgyűjtését, gyakoroltatását és hitelesítését felgyorsítandó, együttműködik a Hugging Face-szel.

A Pollen felvásárlása általános trendhez, az egész MI-iparágat érintő robotikai befektetésekhez kapcsolódik. A fejlesztések elsődleges célpontjai a humanoidok, csökken is az áruk. Jensen Huang, az Nvidia vezérigazgatója szerint a mesterséges intelligenciával rendelkező robotok több-billió dolláros üzleti lehetőséget jelentenek.

Egyelőre persze lassan mendegélnek a forradalminak ígérkező alkalmazások felé. Nyíltforrású rendszerek felgyorsíthatják a folyamatot.

Zöld utat adott a mesterséges intelligenciának egy olasz napilap

A mesterséges intelligencia (MI) nagyszerű könyvkritikákat tud írni, jó a humorérzéke, a minőségi újságírást viszont nem fogja helyettesíteni – nyilatkozta Claudio Cerasa, az MI-vel erőteljesen kísérletező olasz Il Foglio országos napilap szerkesztője.

Az újságot – világpremierként – egy hónapon keresztül teljes egészében MI-vel írt, négyoldalas anyaggal együtt árusították. Az április második felében véget ért teszt hatalmas sikernek bizonyult, jelentős mértékben emelkedtek az eladások. Cerasa és munkatársai el is döntötték, hogy a napilapot ezentúl heti egyszer mesterséges intelligenciával készült melléklettel együtt fogják megjelentetni.

olasz_ujsag.jpg

A kis stábbal, mindössze huszonkét fős személyzettel dolgozó anarcho-konzervatív újság olyan területeken is számít alkalmanként az MI-re, amelyekben nem rendelkeznek szakértelemmel. Ilyen például a pénteki asztronómia-témájú cikk. Cerasa azonban azt is elmondta, hogy az algoritmusok és programok használatának következményeként senki nem fogja elveszíteni az állását.

„Sok kiadó kevesebb újságírót és több gépet lát az MI-ben. Ez nagyon rossz és önmagunknak is árt. A lényeg, hogy megértsük, miből tudunk többet, miből kevesebbet csinálni” – jelentette ki a szerkesztő külföldi újságíróknak.

Szerinte az MI állást teremt mindazoknak, akik tudják, hogyan lehet jól kérdezni, miként hozható ki a legtöbb a technológiából, és a minőségi újságírás színvonalát is növeli. Az újságírókat arra készteti, hogy ássanak mélyebbre, legyenek eredetibbek. Írók is kénytelenek lesznek új elemeket találni, hogy kreatívabbakká és felismerhetőbbekké váljanak – tette hozzá. 

Naponta folytat interakciót meg nem nevezett MI-programmal, és az eredmények folyamatosan meglepik. Legtitokzatosabbnak és leghihetetlenebbnek a valódi iróniát tartja, amire már az első használatkor felfigyelt. Bármilyen témában megkérhető, hogy írjon humoros cikket. Tudja, mit kell tennie – állítja Cerasa.

Könyvkritikában szintén jó az MI, például percek alatt elemzett hétszáz oldalas kötetet, és készített róla érdekes beszámolót. Ugyanakkor meg kellett mondani neki, hogy pozitív vagy negatív legyen, mert a kritikai gondolkodás hiánya komoly hátrányt jelent számára. Cerasa azt szereti, ha amikor útmutatást adna egy újságírónak, az nemet mond rá, mert a szakmában ez az alap. MI esetében azonban nincs így.

A szerkesztő negatívumként említette még meg, hogy alkalmi hibákra figyelt fel, és az MI ismeretbázisa sincs mindig frissítve.

Lézervezérelt robotfarmerek a japán mezőgazdaságban

Önvezető traktorok dolgoznak már nagy és nyílt, azaz könnyen áttekinthető – és navigálható – gazdaságokban, autonóm robotokat viszont különösen kisebb, több kihívást rejtő farmokon nehezebb alkalmazni.

Japán mezőgazdák hamarosan pont ilyen új segítőt kaphatnak, és még ebédszünetre sem lesz szüksége. A köztudottan agráriumi munkaerőhiánnyal küszködő szigetország mérnökei által fejlesztett rendszernek köszönhetően a földeken dolgozó gépek közelebb kerülnek ahhoz a célkitűzéshez, hogy tényleg hasznos robotfarmerekké váljanak. Önállóan közlekedhetnek sorok, ágyások között, például eperültetvényeken jól elboldogulnak.

robot_mezogazdasag.jpg

Költséges infrastruktúrára (drága GPS-re, speciális markerekre) sincs szükség hozzájuk. A nagy farmoktól gyökeresen eltérő kisüzemi gazdaságokban optimális ez a technológia. Ezek a létesítmények általában nem engedhetnek meg maguknak nagyléptékű infrastruktúramódosításokat, és a dinamikus környezetekben a gyárakra optimalizált navigációs módszerek sem működnek kellő hatékonysággal.  

Az új navigációs technológiával viszont a farmon dolgozó robotok GPS-re hagyatkozás vagy költséges helyszíni módosítások nélkül pontosan képesek mozogni vetéssorok között. A LIDAR-ral és valósidejű visszajelzéssel működő rendszer a robotot a célpályától mindig öt centiméter távolságon belül tartja, és egyenetlen terepen is megmarad a megfelelő (mindig maximum öt fok eltérésen belüli) tájolás. 

robot_mezogazdasag0.jpg

Végig közel is marad a rá bízott zöldségekhez, gyümölcsökhöz, ugyanakkor nem annyira közel, hogy esetleg kárt tegyen bennük.

Fejlesztési idejét virtuális tesztekkel rövidítették le. A mérnökök a teszteknek köszönhetően finomhangolhatták még mielőtt a valóságban, üvegházakban elkezdték volna gyakoroltatni. Miután eleget finomítottak a rendszeren, sor kerülhetett valóvilágbeli tesztekre is. Háromszor gyorsabbnak bizonyult a régebbi navigációs módszereknél, és össze sem zavarodott, nem kellett megállnia, forgolódnia, vagy hátrálnia, hogy rájöjjenek, mi is ment félre.  

Amikor a robotnak egy általános területről egy másikra kell mennie, útpont-navigációt használ. Vetéssorok közelébe érve, lézerszkenner segítségével „vetés-/ágyás-navigációra” vált, tartva a meghatározott távolságot és tájolást. Ez a hibrid megközelítés segíti az önlokalizálás nélküli precíziós mozgást még olyan közegekben, például szamócasorok között is, ahol sem GPS, sem más helymeghatározó eszköz nem működik megfelelően.

A technológia nemcsak Japánban, hanem az egész világon komoly szolgálatokat tehet kistermelőknek. Egyre több termőföldön jelenhetnek meg az autonóm segítők – a robotfarmerek.

A helyesírási hibákat és az elütéseket is megérti egy új nyelvmodell

A Meta, a Washingtoni és a Chicagói Egyetem kutatói Byte Latent Transformer (BLT) nevű, frissen fejlesztett rendszere közvetlenül, bájtok formájában dolgozza fel szövegkarakterek csoportjait. 

A modell jobban kezeli az olyan zajos inputokat, mint a helyesírási hibák vagy az elütések, intelligensebben viszonyul a karakterszintű információkhoz, például, hogy hány r betű van az angol strawberry (eper) szóban. Potenciálisan jobban érti az ismerős nyelvekkel elvileg betűcsoportokat megosztó, kevésbé ismert, ritkábban használt nyelveket. 

llmek.jpg

Megközelítésük lényege tokenesítés helyett az input karakterek csoportosítását megtanuló rendszer használata.

A tokenizáló a bájtokat (karaktereket) megtanult szabályok alapján tokenekké – szóvá vagy szórésszé – alakítja; adott sorozatok adott tokenekhez vannak leképezve. Egy nagy nyelvmodell (LLM) hatékonyabb, ha a tokenizálója figyelembe veszi, mennyire könnyű vagy nehéz előrejelezni a következő tokent. Ha képes erre, akkor memóriát és feldolgozási energiát megspórolva, csoportosíthatja a gyakran előforduló tokeneket. Például az „Egyesült Államok fővárosa” kifejezéshez előbb a Washingtont, majd a D-t, a C-t és a pontokat generálja. A „D.C.” utáni token már bonyolultabb, mert sok a működő opció. Kisebb LLM-ek a nehezen megjósolható szöveget kisebb, a könnyebben megjósolhatót nagyobb csoportokba teszik.

Az új modell első szintjén a transzformer inputbájtok szekvenciájából generálja a következő bájtot. A kutatók mérték a bizonytalanságot a bájtcsoportosításhoz, kisebb vagy nagyobb entrópiát állapítottak meg, és a modell bizonytalansága ennek megfelelően változik. A kódoló transzformer megtanulta a csoportokat vektoronként megjeleníteni, míg egy másik transzformer az előző csoportok alapján generálja a következő vektorcsoportot. A vektorok szekvenciájából dekódoló transzformer rekonstruálja a bájtszekvenciát.

A BLT kifejezetten jó eredményt ért el a teszteken. Józanész-kérdésekben és válaszokban megelőzte a Llama 3-at, zajos bemeneteket, különösen karakterek felcserélését és más elírásokat hatékonyabban kezelt, és angol szöveget huszonhat nyelvre (köztük ritka nyelvekre) is jobban fordított.

Mivel közvetlenül bájtokon dolgozik, a BLT természeténél fogva érzékenyebb a nyelvi variációkra.

Ezek a felhasználási esetek teszik fősodorrá a kvantumszámításokat

Szinte közhely már, hogy a kvantumszámítások át fogják alakítani az infokommunikációt és a mindennapokat, és a szakterület a mesterséges intelligencia mellett a közeljövő „legforróbb” technológiai topikja lesz. Csakhogy, az MI-vel összehasonlítva, áttörés helyett egyelőre csupán annak ígéretéről beszélhetünk.

A tendenciák viszont tényleg abba az irányba mutatnak. Kvantumszolgáltatók és startupok egyre több befektetésben részesülnek, az ipar megértette a terület jelentőségét. A felhasználási esetek növekvő száma szintén a laboratóriumokon túli valóságot vetíti előre.

kvantum_felhasznalas.jpg

Az IBM, a Quantinuum, a Banca D’Italia és több egyetem magasszintű optimalizációs feladatokat elvégző, például számos komplex változó legjobb kombinációját megtaláló kvantumszámítási rendszert fejlesztett közösen. A technológia használatával – fizetéskésések csökkentésével – pénzügyi intézetek többmillió dollárt spórolhatnak meg a tőzsdei kereskedésben bejáratott TARGET2-Securities platformon. Az optimalizálás ebben az esetben a leghatékonyabb tranzakció-feldolgozási módszerek leggyorsabb megtalálását jelenti. A Világgazdasági Fórum (WEF) szerint a technológiának ez az alkalmazása 2035-ig kétbillió dollár gazdasági értéket generálhat.

A kvantumfizika szabályai szerint működő való világ, mondjuk, a természet szimulálásában a kvantumszámítógépek kifejezetten jól teljesítenek. Ebből kiindulva, a terület egyik úttörője, a Qubit Pharmaceuticals pontosabban modellezi és jelzi előre gyógyszerek és célpontjaik emberi testben lejátszódó interakcióit. Ezeknek az interakcióknak minimum hetven százaléka túl bonyolult klasszikus komputerekkel történő modellezéshez, tehát a kvantumszámítógépek sokkal pontosabban azonosítanak új gyógyszereket, gyógymódokat. A Google és az IBM már dolgozik is kifejezetten ezekre a feladatokra optimalizált kvantumtechnológián.

Kvantumtechnikákkal fejlesztett hálózatbiztonsági protokollokat nagykockázatú környezetekben, például telekommunikációs és kormányzati infrastruktúrákban alkalmaznak. A Samsung Galaxy Quantum okostelefonjaiba beépítette a kvantumkulcs-elosztást, a Hyundai és a Toshiba pedig kvantumbiztonságos hálózatok létrehozására használta. A China Telekom 2027-ig igyekszik elindítani az első kvantumbiztonságos globális távközlési hálózatot.

Az elektromos járművek legdrágább alkatrészei az akkumulátorok. A minimum méretű, tömegű és gyártási költségű eszközből komoly mennyiségű energia generálása masszív mérnöki kihívás. A Hyundai és az IonQ partnersége viszont az akkumulátorkatódokban használt lítium-vegyületek tulajdonságait a korábbiaknál sokkal jobban modellező technológiát eredményezett. Kutatók így gyorsabban tesztelik az adott anyagokat, felgyorsítják a felfedező folyamatot. Azaz, a kvantumszámításoktól energiahatékonyabb, hamarabb töltődő és többféle anyagból készülő akkumulátorok várhatók.

A JPMorgan Chase hosszú ideje a terület egyik legnagyobb befektetője, kutatási részlegük felsőoktatási intézményekkel közösen dolgozott ki tényleg kiszámíthatatlan számokat generáló módszereket. A klasszikus komputerek determinisztikus módszerével előállított „véletlen” számok valójában nem is véletlenszerűek, tehát megfelelő technikai apparátussal felvértezve feltörhetők, visszafejthetők. A kvantummódszeres véletlen számok képezhetik a jövő mainál jóval biztonságosabb kriptográfiájának alapjait.

Ezek a példák valóvilágbeli, megtörtént fejlesztések és alkalmazások, nem spekulációk. Jövőprognózisok valódi alapjai. Minél több ilyen lesz, annál hamarabb válik mainstreammé a kvantumszámítógép.

Jönnek az érinthető hologramok

A pamplonai Navarra Egyetem kutatói megújítják a holografikus technológiát. Rugalmas szalagokon és gyorsan vetített képeken alapuló rendszerük a felhasználó által fizikailag átalakítható háromdimenziós virtuális objektumokat generál. Lehetővé válik, hogy vezérlő nélkül, közvetlenül piszkáljunk beléjük, bökjünk rájuk.

Az eszköz legtöbbünk számára a kijelzők használatából ismert kézmozdulatokkal működik: nagyításhoz és kicsinyítéshez, zoomoláshoz szükséges mozgásokkal, érintéssel, csúsztatással. Két ujjunk megfelelő mozgatásával járást előidézve, kicsi pálcikaemberként akár digitális tájon is átmehetünk.

hologram_1.jpg

Amikor telefonunkon megérintünk egy gombot, vagy ujjunkkal közvetlenül áthúzunk egy dokumentumot a képernyőn, interakciót folytatunk a készülékkel. Hozzászoktunk ezekhez az interakciókhoz, és a projekt pontosan ezeket a természetes interakciókat teszi lehetővé 3D grafikákkal. Így aknázzuk ki velünk született 3D-s látás és manipulációs készségeinket.

A prototípus a volumetrikus kijelző-technológia legújabb darabja. Technikailag nem azonos a hologrammal, ugyanakkor a sci-fikben látott „hologramok” mindig volumetrikus kijelzőkként írhatók le. Levegőben megjelenő, lebegő, több szögből 3D-snek tűnő képeket látunk ilyenkor. Ezzel szemben a hologramok korlátozott látószöggel rendelkeznek, fenntartva a 3D illúzióját.

A volumetrikus kijelzők hagyományosan hógömb-szerű merev szóróeszközzel (diffúzor) jelenítenek meg képeket. A hatás egyrészt meggyőző, másrészt a képekkel nem valósíthatók meg gyakori interakciók. A pamplonai kutatók kihagyták a kemény anyagot, és miután hat rugalmas (elasztikus) anyaggal kísérleteztek, rugalmas szóróeszköz mellett döntöttek. Viszont úgy kellett megvalósítaniuk, hogy ne deformálódjon megváltoztathatatlanul. Az optikai tulajdonságok ugyanilyen fontosak voltak: szilikonszalagok túl sok fényt visszaverve, „kipukkasztották” a képet, ezért inkább mást választottak. A végső rugalmas gumiszalagokat egymás melletti csíkokba rendezték, és a szalagok a másodpercenként 2880-szor, különböző magasságokban kivetített képeknek megfelelő sebességgel, gyorsan oszcillálnak.

A csíkok közti hézagok természetes pontokat biztosítanak ahhoz, hogy a kéz megragadja őket, vagy átnyúljon rajtuk. A kutatók szerint technológiájukkal megnyílik az út a természetesebben megosztott virtuálisvalóság-élményekhez. Egy ilyen eszközzel több felhasználó folytathat headset nélkül interakciót virtuális objektumokkal.

Az alkalmazásokat illetően, a technológia például múzeumokban lehet különösen hasznos. A látogatók közelítenek az adott objektumhoz, majd interakcióba lépnek tartalmakkal. 

Generatív mesterséges intelligencia kémkedik az amerikai hadseregnek

2024 nagy részében az amerikai hadsereg 15. Tengerészgyalogos Expedíciós Egysége a Csendes-óceánon hajózva, dél-koreai, Fülöp-szigeteki és indonéz vizeken gyakorlatozott. A hajók fedélzetén kísérletet végeztek: a külföldi hírszerzésből történő válogatásért és a lehetséges helyi fenyegetések felderítéséért felelős katonák először használtak munkájukhoz generatív MI-t, egy, a Pentagon által finanszírozott eszközt.

Az új rendszerrel többezer nyílt forrású hírszerzési adatot, nem minősített írásokat, beszámolókat, videókat gyűjtöttek össze különböző országokból. Gyorsabban tették, mint korábban manuális eszközökkel: a külföldi forrásokat nagy nyelvmodellekkel (LLM) fordították le és készítettek összefoglalót róluk, míg a napi és heti hírszerzői jelentésekben a vezetők szintén használtak MI-t.

ai_spy.jpg

A rendszert a 2019-ben a CIA és az amerikai hírszerző közösség veteránjai által alapított Vannevar Labs fejlesztette. A startup a névadásban Tolkien által ihletett Palantir és Anduril, valamint a Seal AI mellett komoly érdemeket szerez az MI drónokon és autonóm járműveken túlmutató katonai alkalmazásában. Szoftveres forradalmat visznek véghez: teljesen átalakítják a Pentagon hadviselés és megfigyelés közbeni adatgyűjtését, kezelését és értelmezését.

A hadsereg gépilátás-modellt és hasonló mesterségesintelligencia-eszközöket legalább 2017 óta fejleszt, az emberi beszélgetésre képes megoldások viszont új határokat feszegetnek. A nevével „a huszadik század legfontosabb mérnöke”, az úttörő Vannevar Bush (1890-1974) előtt tisztelgő Vannevar Labs meglévő LLM-eket (OpenAI, Microsoft stb.) és néhány saját egyedi modellt használ a 2021 óta napi 180 országban, nyolcvannál több nyelven gyűjtött adatokhoz.

A startup technológiája képes közösségimédia-profilokat elemezni, Kínában is áttörni tűzfalakat, hogy hozzáférjen nehezen beszerezhető vagy online szinte megtalálhatatlan infókhoz. Munkáját az illegális árukereskedelmet azonosító rádióhullámokat monitorozó fizikai szenzorok segítik.

A Vannevar Labs MI-modelljei ezeket az infókat fordítják le, detektálják a veszélyt, politikai hangulatot – érzelmeket – elemeznek, az eredményt pedig a ChatGPT-hez hasonló chat interfész közvetítésével juttatják el az érintettekhez. A nemzetközi fentanil-kereskedelem ellátási láncaitól kezdve a Fülöp-szigeteki ritkaföldfémekig, változatos témákban szednek össze kritikus infókat, hogy az amerikai hadsereg azokra alapozva hozzon jó döntéseket.

A tapasztalatok pozitívak voltak, a rendszer nem hibázott fontos témákban. Hibák persze vannak, de azok inkább általánosak, például az időnként gyenge internetkapcsolat miatt lassabban szintetizálja az adatokat, pláne, ha fényképeket és videókat kell feldolgoznia.

Az első teszt, a „jéghegy csúcsa” után, idén februárban amerikai katonai vezetők a generatív MI masszív használatát vetítették előre. Kritikus hangok főként a kifejezetten szubjektív érzelemelemzés miatt aggódnak. Az MI ezen a területen a legkevésbé pontos, a Vannevar Labs rendszere viszont lényegében csak arra koncentrál egyelőre, hogy az adott anyag USA-barát vagy -ellenes. Propaganda azonosításában szintén bőven akad fejlesztenivaló rajta.

süti beállítások módosítása