Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Világcsúcs: soha nem volt még ennyi elektróda agyi implantátumban

2024. június 06. - ferenck

Az agy-számítógép interfészeket (brain-computer interface, BCI) fejlesztő Precision Neuroscience, Elon Musk Neuralinkjének legnagyobb vetélytársa bejelentette: új világcsúcsot állítottak fel az élő emberi agyra helyezett, idegsejteket letapogató elektródák számában – 4096-tal bőven rávertek a tavaly beállított eddigi rekord 2048-ra.

Ha ilyen sűrűn helyezik el az elektródákat, az idegsejtek tevékenysége korábban soha nem látott felbontásban, precizitással térképezhető fel. Jobban segítenek gondolatok szándék szerinti cselekvéssé dekódolásában. A cég a beszéd és a mozgás képességét szeretné visszaadni stroke vagy gerincoszlop-sérülés miatt lebénult betegeknek.

precision_neuroscience.jpg

A Precision Neuroscience-et 2021-ben az egykori Neuralink-társalapító idegsebész-mérnök Ben Rapaport alapította három társával (kettő közülük szintén a Neuralinket hagyta el). Musk cégével az invazív agyi implantátumok gyakran emlegetett biztonsági problémái miatt szakítottak. Cégük alapfilozófiája a minimális beavatkozás, a méretezhetőség és a biztonság.

A Neuralink mostani BCI-eszköze 1024 elektródát tartalmaz 64, hajszálnál vékonyabb huzalra elosztva. A huzalok három-öt milliméterig hatolnak az emberi agyba, de most már a nyolc milliméter is engedélyezett.

A Precision Neuroscience technológiájához nem kell behatolni az agyba, mert a tetejére helyezik. Az eszköz legalább egy, az emberi hajnál ötször vékonyabb sárga filmet tartalmaz. Filmenként 1024 elektródát rácsmintázatba ágyaznak. Mivel az eszköz moduláris, több film ágyazható minden egyes eszközbe (négy filmmel jön ki a 4096).

A filmeket minimálisan invazív műtéttel csúsztatják az agyra: csak egy vékony rés kell a koponyán, amin az agy felületére csúsztatják a szalagszerű sárga eszközt. Az elektródák adatait feldolgozó egység a koponya és a fejbőr között helyezkedik el. A filmet úgy tervezték, hogy ha az implantátumot el kell távolítani az agyból, sérülésokozás nélkül kicsúsztatható belőle.

Áprilisban jóindulatú tumor eltávolítása után, egy alvó páciens nyitott koponyájában helyezték el a 4096 elektródás négy filmet. Az eszköz mintegy nyolc négyzetcentiméter terület neurális tevékenységét rögzítette.

Rapaport szerint a felvétel fontos lépés egy új korszak felé. Ha ekkora területen és léptékben képesek vagyunk kritikus információ gyűjtésére, sokkal mélyebben megérthetjük az agyműködést.

Ez volt a tizennegyedik alkalom, hogy az eszközt emberi agyra csúsztatták. 2025-ben várható a kereskedelmi forgalmazás.

Agyával akar vezérelni Tesla-robotot a Neuralink első páciense

Az 1995-ös születésű Noland Arbaugh az első és eddigi egyetlen humán Neuralink-páciens 2016-ban, úszás közben szenvedett bénulást. Idén esett át az agyi beültetés műtéten. Elon Musk vállalata évek óta fejlesztette a technológiát, és a közfelháborodást kiváltó, botrányos majomkísérletek után, 2024-ben kapták meg a szükséges engedélyeket ahhoz, hogy alkalmazhatják emberre.

Arbaugh agyi implantátumával, tehát gondolati úton képes már videójátékot irányítani, és vágya, hogy kapjon egy Tesla Optimus Robotot, amelyet szintén elméjével vezérelne. A robot mindent megtenne neki, lényegében ápolójává válna – nyilatkozta.

neuralink_2.jpg

Később Tesla-járművet is szeretne. Szintén gondolati úton, az agyába ültetett Neuralink-eszközzel vezetné.

Egyelőre azonban nem tart még sem a robotnál, sem a kocsinál, mindennapos cselekvésekre, például zene és hangoskönyvek lejátszására viszont képes már, amelyek önmagukban óriási előrelépésnek számítanak.

neuralink0_2.jpg

Az implant használatához nem kell különösebben komoly agytevékenység, elég arra gondolnia, merre akarja mozgatni a kurzort. A beültetéssel annyira elégedett, hogy idővel, családját segítendő, távmunkában kíván otthonról dolgozni.

Az X-en (a korábbi Twitteren) online közvéleménykutatást végzett. Bejelentette, hogy dolgozni, családjának pedig házat építeni akar. A kérdés arra vonatkozott, hogy pénzzé tegye-e közösségimédia-fiókjait, streamelje-e videójátékos tevékenységét, indítson-e GoFundMe közösségitámogatás-kampányt, vagy mindezt egyszerre tegye. Ötvenhat százalékkal a „mindent egyszerre” opció nyert.

A beültetés óta néhány vezeték lassan meglazult az agyában, és az implantátum nem működött rendeltetésszerűen. A Neuralink mérnökei azonban módosítottak a szoftveren, és a rendszer stabilizálódott. Arbaugh mindenesetre nem idegeskedik már miatta.

Közben a Neuralink a második műtétet tervezi. Arbaugh segíteni szeretne az újabb páciensnek.

A Sony betámadta a generatív mesterséges intelligenciát

A lemezipar legnagyobb üzleti és legtöbb kiadót tömörítő vállalkozása, az UMG (Universal Music Group) tavaly szólította fel az Apple Musicot és a Spotify-t, hogy blokkolják felvételeit az azokat letöltő mesterségesintelligencia-fejlesztők elől, illetve MI-vel generált UMG-szerződéssel védett anyagok eltávolítását indítványozta a YouTube-nak és a Spotify-nak.

Áprilisban kétszáznál több zenész szólította fel a streaming-szolgáltatókat és az MI-fejlesztőket, hogy fejezzék be munkáik ingyenes használatát modellek gyakoroltatására.

sony_versus_ai.jpg

Az UMG legnagyobb versenytársa, a képzeletbeli dobogó második helyét elfoglaló és 2023-ban a piac huszonhárom százalékát uraló Sony Music Group májusban lépett (az UMG részesedése harminckét százalék). Bejelentette, hogy MI-fejlesztők a csoport szellemi tulajdonához tartozó zenéken engedély nélkül tanítottak be modelleket, és a cég által birtokolt média- és más adatok bármilyen gyűjtése sérti a szerzői jogokat. Egyelőre nem derült ki, hogy a fejlesztők valóban jogsértő tevékenységet követtek-e el.

A Sony levélben is értesítette őket, és a tiltás dalszövegekre, zenei videókra, albumokra egyaránt kiterjed: „nem használhatók bármilyen MI-rendszer gyakoroltatására, fejlesztésére, kereskedelmi forgalmazására.”

Több mint hétszáz fejlesztő és streaming-szolgáltató kapta meg a levelet. A fejlesztőknek meg kell mondaniuk, milyen munkákat használtak modellek trenírozására. A felszólítottak között szerepel a Google, a Microsoft, a szövegből zenét generáló appok, a Suno és az Udio mögötti vállalatok.

A streaming-szolgáltatóktól (köztük az Apple-től és a Spotify-tól) felhasználási szabályzatuk módosítását kérték, hogy senki ne használhassa a platformokat a Sony szellemi tulajdonának gyűjtésére. A kiadó viszont fenntartja magának a jogot, hogy bizonyos fejlesztőknek engedélyezze anyagai oktatási gyakorlóadatként történő használatát. Ha meg akarnak egyezni, e-mailen vegyék fel a kapcsolatot a Sonyval – áll a közleményben.

Nem véletlen a lemezipari nagyágyú figyelmeztetésének időzítése. Az MI-vel generált zenék minősége mostanában kezdi elérni a mainstream közönség ingerküszöbét, és a jövőben nyilvánvalóan még jobbak lesznek, tehát komoly bevételek jöhetnek össze belőlük.

2024 a multimodális mesterséges intelligenciák éve

A nagy mesterségesintelligencia fejlesztők közötti verseny egyre elképesztőbb tempóban eredményez egyre jobb modelleket. Az OpenAI GPT-4o-ja multimodális (teljeskörű) inputtal és outputtal mutatja meg a végpontok közötti modellezés értékét. 

Jelentős teljesítmény- és gyorsaságnövekedés, költségcsökkenés az eredmény. Tokenek gyorsabb és olcsóbb feldolgozásával az MI érzékenyebbé válik, gyengülnek a hatékony ágensfolyamatok használatának akadályai, míg kép-, hang- és szövegfeldolgozás nagyobb integrációjával praktikusabbak a multimodális alkalmazások.

multimodalitas.jpg

A GPT-4o mellett megjelent a Google Gemini 1.5-e, és a Meta is bejelentette a Chameleon modellt. A „média-mindenevők” rivalizálásával fejlesztők és felhasználók egyaránt jól járnak, biztosak lehetünk abban, hogy 2024-ben további izgalmas appokkal szaporodnak a lehetőségeink.

A GPT-4o – az „o” az „omni”, azaz a minden (előtag) rövidítése – gyorsabban, olcsóbban és sok esetben pontosabban fogad el és generál szöveges, képes, mozgóképes és hanganyagokat. 

multimodalitas0.jpg

Szöveg és kép input, és csak szöveg output a ChatGPT-n keresztül most is elérhető, és hamarosan jönnek a képek is. Beszéd input és output fizető felhasználók számára lesz hozzáférhető a következő hetekben. Az audiót és a videót első körben a partnerek használhatják, és csak utánuk a szélesebb nyilvánosság.

A GPT-4o-t többfajta médiatípuson gyakoroltatták, hogy szintén többfajta médiatípust és a köztük lévő kapcsolatokat gyorsabban és pontosabban dolgozza fel, mint a GPT-4 különféle médiatípusokat külön-külön kezelő korábbi változatai. A kontextus hossza a GPT-4 Turbo verziójával azonos, viszont jóval a Gemini 1,5 Pro modell által újonnan beállított kétmilliós limit alatti 128 ezer token.

Teljesítményét illetően, az összehasonlító teszteken több területen felülmúlta a Gemini Pro 1.5-öt: szöveg, kód és kép megértésében. Szövegfelismerésben jobban vizsgázott, mint a saját Whisper-larger-v.3, szövegek beszéddé alakításában (speech-to-text) pedig a CoVoST 2 fordítót „verte meg.”

Csak júniusban járunk, de már borítékolható, hogy 2024 a multimodális generatív MI-modellek éve lesz!

A világ nincs felkészülve a mesterséges intelligencia áttörésére

Május közepén az OpenAI bemutatta a multimodális GPT-4o-t, a Google pedig az okostelefonos kamerával helyszíneket azonosító, számítógépes kódokat olvasó és elmagyarázó, alliteráló mondatokat író Astra projektet. 

Május harmincadikán és harmincegyedikén, Szöulban kerül sor az MI Világ Csúcstalálkozó 2024-re. Politikusok, szakértők és cégvezetők vesznek részt rajta. A rendezvényre huszonöt tudós, köztük a terület „keresztapáinak” tartott Geoffrey Hinton és Yoshua Bengio, valamint Yuval Noah Harari és más hírességek ajánlásokat fogalmaztak meg.

vilag_nincs_felkeszulve0.jpg

A világ nincs felkészülve az MI áttöréseire, a kormányok nem hoztak elegendő szabályozó intézkedést, és mivel a techcégek autonóm rendszerekre történő váltásával az MI hatásai megsokszorozódnak, a döntéshozóknak olyan biztonsági rendszabályokat kellene kidolgozniuk, amelyek rögtön érvénybe lépnek, mihelyst a rendszerek elérték a képességek bizonyos szintjét – írják.

vilag_nincs_felkeszulve.jpg

A Szélsőséges MI-kockázatok kezelése gyors fejlődés közepette című tudományos anyag szigorúbb elvárásokat életbe léptető kormányzati biztonsági kereteket ajánl, egyben a frissen felállított MI-biztonsági szervezetek nagyobb anyagi támogatását, valamint az autonóm mesterségesintelligencia-rendszerek fontos társadalmi szerepének korlátozását javasolja.

Az ígéretes első lépések ellenére a társadalmi reakció nem áll arányban a sok szakértő szerint nagyon gyors, átalakító fejlődés lehetőségével. Le vannak maradva az MI-biztonsági kutatások, a kormányzati kezdeményezésekből hiányoznak a visszaéléseket és a meggondolatlan alkalmazásokat megelőző mechanizmusok, az autonóm rendszerekről pedig szinte semmit nem mondanak.

Fejlett MI-rendszereken a tipikusan intelligens létformák által megvalósított feladatokra alkalmas technológiákat értik. Betegségek gyógyíthatók, az életszínvonal növelhető velük, viszont erodálhatják a társadalmi stabilitást, és lehetővé teszik az automatizált hadviselést is. Ebből a szempontból jelent veszélyt a technológiai szektor eltolódása az önállóan cselekvő és célokat követő autonóm rendszerek – az általános mesterséges intelligencia (Artificial General Intelligence, AGI) – felé. Az adottságok és az autonómia növelésével masszívan nőnek az MI hatásai és kockázatai is.

Nehezen tanulnak kínai szövegeken a mesterségesintelligencia-modellek

A multimodális GPT-4o-val hanggal, szöveggel, videóval interakcióba léphetünk. A modell megjelenése utáni napokban viszont több probléma felmerült az OpenAI csúcstermékével kapcsolatban. 

Scarlett Johansson például hangja jóváhagyása nélküli utánzásával vádolta a céget. Aztán kiderült, hogy a szövegek hatékonyabb elemzésében és feldolgozásában segítő tokenizálóhoz használt adatokat kínai spam webhelyek szennyezik. Hallucinációk, gyengébb teljesítmény és helytelen használat lehetnek a következmények.

gpt4o_chinese0.jpg

A GPT-4o nyilvános és jelentősen frissített token-könyvtárában a száz leghosszabb kínai tokenből legalább kilencven (például „ingyenes japán pornóvideók megtekintésre”, „pekingi autóverseny-fogadás”, „minden nap kínai jóléti lottó” stb.) ilyen honlapokról származik – állítják többen. A nyelvmodell nyilván nem ezekkel és hasonló tokenekkel fog kínaiul is jól teljesíteni.

Néhány ilyen elkerülhetetlenül belecsúszik a tanuláshoz használt adatkészletbe, már csak azért is, mert a felnőtt tartalom vagy a fogadások nagyon népszerűek online. Modellek kínaiul gyakoroltatására viszont nyilván nem kilencven százalékban ezeket kellene használni, ennyire nem lehetnek rossz minőségűek a kínai nyelvű adatok.

gpt4o_chinese.jpg

A probléma jórészt a hozzáférhető gyakorlóadatok minőségében rejlik, hogy mikkel trenírozta az OpenAI a GPT-4o-t. Kiderült, hogy ha a trenírozás nem a kínai állami média anyagain történik, nagyjából tényleg erre számíthatunk. Vagy a „hivatalos” változatot kapjuk, hogy hogyan lehet az országról beszélni, vagy a valódi beszélgetést ellehetetlenítő szemetet. A nem pornó és hirdetéses tokenekben például ilyenek szerepelnek: „kínai tulajdonságjegyeket tartalmazó szocializmus”, „Kínai Népköztársaság” stb. Mivel ezek a kifejezések előfordulnak a GPT-4o repertoárjában, elég egyértelmű, hogy a hivatalos kínai média is a források között szerepel. (Az OpenAI köztudottan elég szűkszavú a modelljeihez használt gyakorlóadatok eredetét illetően.)

A nagyvállalat nincs egyedül, a problémával mások is szembesültek. Nincsenek minőségi kínai szövegek nagy nyelvmodellek (LLM-ek) trenírozásához. Talán azért nem, mert a kínai internetet a helyi vezető cégek uralják, és sem egymás között, sem kívülállókkal nem osztozkodnak. A Google keresőmotorja sem teljesít jól, ha kínaiul kutakodik. A WeChat platformjain csak a WeChat keresgélhet, a Douyin (a kínai TikTok) tartalmaiban csak a Douyin, és így tovább. A tényleges beszélgetések ezeken és nem a spamoldalakon folynak.

A minőségi gyakorlóadatok hiánya sokkal nagyobb probléma, mintha nem sikerül kiszűrni a pornót vagy az általános nonszenszeket. Ha nincs megfelelő adatkészlet, MI-fejlesztőcégeknek jóval több munkát kell elvégezniük a sajátjuk kidolgozásában. Úgy tűnik, az OpenAI ezt nem tette meg, bár a Kínai Népköztársaságban élő kínaiak se így, se úgy nem tudják használni a cég mesterségesintelligencia-modelljeit.

Hangklónozással kelnek életre az USA Legfelsőbb Bíróságának fontos pillanatai

1954. május 17-én, az Amerikai Legfelsőbb Bíróság épületén kívül senki nem hallhatta, ahogy Earl Warren, a testület elnöke bejelentette az iskolai deszegregációról szóló történelmi döntést.

Hetven évvel később, innovatív hangklónozó technológia jóvoltából lehetséges, hogy halljuk Warrent és az érveket. Az anyag erre a célra tervezett honlapon hallgatható meg. Az Északnyugati Egyetem korábbi tanára, Jerry Goldman a fejlesztő, aki azért mérges, mert a bíróság 1955 előtt nem vett fel hanganyagot. A szöveges leiratok sajnos nem ugyanazok.

usa_legfelsobb_birosag.jpg

De hiába készülnek 1955 óta hangfelvételek, 1969-ig senki nem hallhatta. A Nemzeti Archívum akkor tette nyilvánossá őket oktatási és jogi kutatásokra, a nagy nyilvánosság számára viszont csak 1993-tól elérhetők. A korai 2000-es évektől a bíróság saját honlapján is posztol anyagokat, igaz, többnapos késéssel. Rendszeres élőközvetítés (livestream) csak 2020-tól van.

Goldman egy éve látott egy előadást amelyben mesterséges intelligenciával keltettek életre egy ismerős hangot. Rögtön felmerült benne, hogy a technológiát esetleg történelmi bírósági esetekre alkalmazhatná. Megkereste egy korábbi diákját, az interaktív audióval foglalkozó Spoolert vezető James Boggst, akit érdekelt az ötlet.

usa_legfelsobb_birosag0.jpg

Első lépésben 1955 előtti hanganyagokat kerestek. Nem volt könnyű dolguk, 1955 utániaknál már inkább. Találtak, és MI-technológiával a hangmintákat a történelmi leiratokat felolvasó színészekével keverték, hogy úgy tűnjön, mintha ismét beszélnének.

A tényleges viták elhúzódtak: tizennyolc óra három nap alatt, harmincnyolc résztvevővel. Goldman egy órára szűkített, negyvenöt perces prezentációval, benne Warren felolvasásával. A kutató Warren írott hagyatékát is átnézte, hogy az újraalkotásnál a főbíró személyiségét is figyelembe vegyék.

A technológia lenyűgöző, viszont sokan félnek, hogy hazugságokat adnak vele ismert személyek szájába. Az elnökválasztás előtt különösen tartanak ettől a nem éppen kecsegtető lehetőségtől. Egyesek szerint a szerzői joghoz hasonlóan, elhunyt személyek esetében is hetven évig kellene várni az „újrahasznosításra.” A szabályozás azonban nem egyértelmű – azért sem az, mert nincs.

Boggs szerint a mélyhamisítványokkal (deepfakes) ellentétben munkájuk „mélyigazság” (deep truth). Nem hoznak létre új tartalmat, valóban elhangzott szövegek hallhatók, hitelességüket történelmi dokumentumok igazolják.       

Újrahasznosítja a verejtéket a Dűne ihlette ruha

Frank Herbert epikus sci-fije, a Dűne első kötete 1965-ben, a filmes adaptáció első része 2021-ben, második része idén jelent meg. A képzeletbeli Arrakis bolygó sivatagi tája mindannyiunk tudatába rögzült, a teljes testet elfedő „cirkoruhával” (stillsuit) együtt.

A mikro szendvicsanyagból készült ruha hatékony szűrő- és hőcsererendszer, a bőrön lévő rétege porózus, a veríték a test lehűtését követően tűnik el belőle. A következő rétegben hőcserélő szálak és hőkiválasztó vannak. A folyadék keringéséhez a test mozgása, elsősorban a légzés szolgáltatja az energiát. A gyűjtőzsebekben visszanyer víz a nyaki csövön szívható ki. A sivatagban az emberek szűrőt viselnek az arcukon, a kilégzés azon keresztül megy.

dune.jpg

A szűrő mindenféle folyadékot újrahasznosít, a cirkóruha nagy előnye, hogy viselője vízszintjét külső forrás nélkül tudja feltölteni, tehát a legzordabb körülmények között sincs másra utalva.

Az ötlet ugyan sci-fiből ered, de oly sok sci-fi ötlethez hasonlóan, valóságos cirkóruha fejlesztésére ihletett személyeket. A The Hacksmith YouTube-csatorna mérnökei ugyanis elkészítették. Változatuk nem hasonlít az eredetire, de a valóságtól sincs annyira elrugaszkodva.

dune0.jpg

A tervezőknek sikerült megvalósítaniuk, hogy a ruha összegyűjtse a test verejtékét, viselője pedig egy csövön keresztül megigya a folyadékot. Termoelektromos hűtőt, számítógépet és más készülékeket elektromos töltés két különböző fémen történő átvezetésével hűtő, kis rácsos eszközt használtak hozzá. A készülék hideg oldala a ruhában maradt, és a beszorult levegőben – nem úgy, mint a párátlanító – magához vonzza a nedvességet.

Eközben egy ivóhólyag és a helyi sportszer-boltban vásárolt vízszűrő kombinációja összegyűjtötte a ruha viselése közben keletkező vizet, ami (inkább a nevettetés, meghökkentés kedvéért) csövön keresztül meg is iható. Éles helyzetben nyilván kevésbé megmosolyogtató.

Az egyetlen nap alatt összedobott csináld magad (Do-it-Yourself, DiY) megoldás természetesen nem tökéletes, és nem biztos, hogy elég lenne az Arrakis sivatagában.

A ChatGPT immáron Reddit-tartalmakhoz is legálisan férhet hozzá

A Reddit közösségimédia-szolgáltató bejelentette, hogy partnerségre lépett a GPT legújabb változatával, a GPT-4o-val május közepén debütált OpenAI-val. A szerződés értelmében a ChatGPT fejlesztővállalata mesterségesintelligencia-modelljeit a Reddit több tízmillió napi felhasználója által posztolt anyagokon (is) gyakoroltathatja.

Az egyezséggel a közösségi médium is jól jár, mert felhasználói és moderátorai számára az OpenAI MI-vel működtetett funkciókat hoz létre. Más szempontból szintén hasznos számára a deal: a bejelentés után a cég tőzsdei részvényei tíz százalékkal emelkedtek. Azaz, a Reddit a hirdetések mellett szélesíteni próbálja bevételi forrásait.

reddit_2.jpg

Az utóbbi hónapokban az OpenAI az Associated Press-szel és a Financial Times-szal is kötött hasonló szerződést.

2024-ben az MI-versenyfutás egy másik kulcsszereplője, a Google szintén megegyezett a Reddittel, ők is trenírozhatják mesterségesintelligencia-modelljeiket a közösségi médium anyagain.

A szerzői jogi problémák miatt, pereskedéseket megelőzendő, egyre gyakoribbak az ilyen szerződések MI-fejlesztőcégek és tartalomgyártók között. A korábbi gyakorlattal ellentétben, a modellek immáron legálisan használhatnak értékes online tartalmakat.

Az Egyesült Államokban és az Európai Unióban is sokan megkérdőjelezik, hogy MI-eszközök gyakoroltathatók-e jogvédett tartalmakon, illetve bizonyos kivételek vonatkoznak-e rájuk, és ha igen, akkor milyen mértékben.

Az USA-ban egymástól függetlenül több per folyik MI-fejlesztők (főként az OpenAI) ellen: George RR Martin, a Trónok harca szerzője, a színész Sarah Silverman és a New York Times egyaránt jogi úton próbálkozik.

A világ legnagyobb zenei kiadója, a Sony levelet írt a napokban a Google-nak, a Microsoftnak és az OpenAI-nak. Felszólította a cégeket, hogy tudassák velük, ha a Sony jogvédelme alá tartozó muzsikákat MI-rendszereik gyakoroltatására használják.

Szemmozgással irányítható az iPhone és az iPad

Az Apple az év második felében operációs rendszerein működő új hozzáférési funkciókat jelentett be. A cég szokásához híven, előzetesen nem nevezte meg az iOS18-at, de nyilván arról és más operációs rendszereiről van szó.

A Szemkövetés (Eye Tracking) lényege, hogy fizikailag korlátozott iPhone- és iPad-felhasználók szemmel irányíthatják készülékeiket. Elég lesz az okostelefonra vagy a tabletre nézni, és a Vision Pro VR/AR headsethez hasonló új IOS tekintet-rendszer működésbe lép.

apple_vezerles.jpg

A Szemkövetés az előlapi kamera segítségével határozza meg, mit néz a felhasználó a képernyőn. Így válik lehetővé a csak szemmel, érintés nélkül történő navigáció. Például ránézve egy gombra, kiemeljük azt, néhány másodpercig rajta tartjuk a tekintetünket, hogy a rendszer aztán kiválassza.

A szintén új Music Haptics (zenetapintás/érintés) siketeket és gyengén hallókat hivatott támogatni. Rendeltetése, hogy ők is úgy hallják és élvezzék a zenét, mint bárki más. Az iPhone haptikus motorját használva, játssza le az elhangzott muzsikával szinkronizálódó koppintásokat és finom rezgéseket.

A Vehicle Motion Cues a mozgásszervi betegségben szenvedő iOS-felhasználókat segíti, amikor iPhone-jukat vagy iPad-jüket utasként használják mozgó járműben. Ha a mozgásjelzők működésbe lépnek, a rendszer a jármű mozgását követő, animált pontokból álló mintázatot fed le. A funkció csökkenti az érzékszervi összeütközéseket az agyban, minimalizálja a mozgásszervi betegség érzetét.

Az úgynevezett Vokális Parancsikonokkal egyedi műveleti kifejezéseket rendelhetünk parancsikonok elindításához, bonyolult, többlépcsős műveletek végrehajtásához. Az agyi bénulásban, amiotrófiás laterális szklerózisban vagy stroke-tól szenvedő felhasználókat támogató „Atipikus beszéd figyelése” móddal pontosabb a diktálás és a beszédfelismerés.

Az Apple a hozzáférést javító több más kisebb megoldást szintén bejelentett.

süti beállítások módosítása