Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Nehezen tanulnak kínai szövegeken a mesterségesintelligencia-modellek

2024. május 30. - ferenck

A multimodális GPT-4o-val hanggal, szöveggel, videóval interakcióba léphetünk. A modell megjelenése utáni napokban viszont több probléma felmerült az OpenAI csúcstermékével kapcsolatban. 

Scarlett Johansson például hangja jóváhagyása nélküli utánzásával vádolta a céget. Aztán kiderült, hogy a szövegek hatékonyabb elemzésében és feldolgozásában segítő tokenizálóhoz használt adatokat kínai spam webhelyek szennyezik. Hallucinációk, gyengébb teljesítmény és helytelen használat lehetnek a következmények.

gpt4o_chinese0.jpg

A GPT-4o nyilvános és jelentősen frissített token-könyvtárában a száz leghosszabb kínai tokenből legalább kilencven (például „ingyenes japán pornóvideók megtekintésre”, „pekingi autóverseny-fogadás”, „minden nap kínai jóléti lottó” stb.) ilyen honlapokról származik – állítják többen. A nyelvmodell nyilván nem ezekkel és hasonló tokenekkel fog kínaiul is jól teljesíteni.

Néhány ilyen elkerülhetetlenül belecsúszik a tanuláshoz használt adatkészletbe, már csak azért is, mert a felnőtt tartalom vagy a fogadások nagyon népszerűek online. Modellek kínaiul gyakoroltatására viszont nyilván nem kilencven százalékban ezeket kellene használni, ennyire nem lehetnek rossz minőségűek a kínai nyelvű adatok.

gpt4o_chinese.jpg

A probléma jórészt a hozzáférhető gyakorlóadatok minőségében rejlik, hogy mikkel trenírozta az OpenAI a GPT-4o-t. Kiderült, hogy ha a trenírozás nem a kínai állami média anyagain történik, nagyjából tényleg erre számíthatunk. Vagy a „hivatalos” változatot kapjuk, hogy hogyan lehet az országról beszélni, vagy a valódi beszélgetést ellehetetlenítő szemetet. A nem pornó és hirdetéses tokenekben például ilyenek szerepelnek: „kínai tulajdonságjegyeket tartalmazó szocializmus”, „Kínai Népköztársaság” stb. Mivel ezek a kifejezések előfordulnak a GPT-4o repertoárjában, elég egyértelmű, hogy a hivatalos kínai média is a források között szerepel. (Az OpenAI köztudottan elég szűkszavú a modelljeihez használt gyakorlóadatok eredetét illetően.)

A nagyvállalat nincs egyedül, a problémával mások is szembesültek. Nincsenek minőségi kínai szövegek nagy nyelvmodellek (LLM-ek) trenírozásához. Talán azért nem, mert a kínai internetet a helyi vezető cégek uralják, és sem egymás között, sem kívülállókkal nem osztozkodnak. A Google keresőmotorja sem teljesít jól, ha kínaiul kutakodik. A WeChat platformjain csak a WeChat keresgélhet, a Douyin (a kínai TikTok) tartalmaiban csak a Douyin, és így tovább. A tényleges beszélgetések ezeken és nem a spamoldalakon folynak.

A minőségi gyakorlóadatok hiánya sokkal nagyobb probléma, mintha nem sikerül kiszűrni a pornót vagy az általános nonszenszeket. Ha nincs megfelelő adatkészlet, MI-fejlesztőcégeknek jóval több munkát kell elvégezniük a sajátjuk kidolgozásában. Úgy tűnik, az OpenAI ezt nem tette meg, bár a Kínai Népköztársaságban élő kínaiak se így, se úgy nem tudják használni a cég mesterségesintelligencia-modelljeit.

Hangklónozással kelnek életre az USA Legfelsőbb Bíróságának fontos pillanatai

1954. május 17-én, az Amerikai Legfelsőbb Bíróság épületén kívül senki nem hallhatta, ahogy Earl Warren, a testület elnöke bejelentette az iskolai deszegregációról szóló történelmi döntést.

Hetven évvel később, innovatív hangklónozó technológia jóvoltából lehetséges, hogy halljuk Warrent és az érveket. Az anyag erre a célra tervezett honlapon hallgatható meg. Az Északnyugati Egyetem korábbi tanára, Jerry Goldman a fejlesztő, aki azért mérges, mert a bíróság 1955 előtt nem vett fel hanganyagot. A szöveges leiratok sajnos nem ugyanazok.

usa_legfelsobb_birosag.jpg

De hiába készülnek 1955 óta hangfelvételek, 1969-ig senki nem hallhatta. A Nemzeti Archívum akkor tette nyilvánossá őket oktatási és jogi kutatásokra, a nagy nyilvánosság számára viszont csak 1993-tól elérhetők. A korai 2000-es évektől a bíróság saját honlapján is posztol anyagokat, igaz, többnapos késéssel. Rendszeres élőközvetítés (livestream) csak 2020-tól van.

Goldman egy éve látott egy előadást amelyben mesterséges intelligenciával keltettek életre egy ismerős hangot. Rögtön felmerült benne, hogy a technológiát esetleg történelmi bírósági esetekre alkalmazhatná. Megkereste egy korábbi diákját, az interaktív audióval foglalkozó Spoolert vezető James Boggst, akit érdekelt az ötlet.

usa_legfelsobb_birosag0.jpg

Első lépésben 1955 előtti hanganyagokat kerestek. Nem volt könnyű dolguk, 1955 utániaknál már inkább. Találtak, és MI-technológiával a hangmintákat a történelmi leiratokat felolvasó színészekével keverték, hogy úgy tűnjön, mintha ismét beszélnének.

A tényleges viták elhúzódtak: tizennyolc óra három nap alatt, harmincnyolc résztvevővel. Goldman egy órára szűkített, negyvenöt perces prezentációval, benne Warren felolvasásával. A kutató Warren írott hagyatékát is átnézte, hogy az újraalkotásnál a főbíró személyiségét is figyelembe vegyék.

A technológia lenyűgöző, viszont sokan félnek, hogy hazugságokat adnak vele ismert személyek szájába. Az elnökválasztás előtt különösen tartanak ettől a nem éppen kecsegtető lehetőségtől. Egyesek szerint a szerzői joghoz hasonlóan, elhunyt személyek esetében is hetven évig kellene várni az „újrahasznosításra.” A szabályozás azonban nem egyértelmű – azért sem az, mert nincs.

Boggs szerint a mélyhamisítványokkal (deepfakes) ellentétben munkájuk „mélyigazság” (deep truth). Nem hoznak létre új tartalmat, valóban elhangzott szövegek hallhatók, hitelességüket történelmi dokumentumok igazolják.       

Újrahasznosítja a verejtéket a Dűne ihlette ruha

Frank Herbert epikus sci-fije, a Dűne első kötete 1965-ben, a filmes adaptáció első része 2021-ben, második része idén jelent meg. A képzeletbeli Arrakis bolygó sivatagi tája mindannyiunk tudatába rögzült, a teljes testet elfedő „cirkoruhával” (stillsuit) együtt.

A mikro szendvicsanyagból készült ruha hatékony szűrő- és hőcsererendszer, a bőrön lévő rétege porózus, a veríték a test lehűtését követően tűnik el belőle. A következő rétegben hőcserélő szálak és hőkiválasztó vannak. A folyadék keringéséhez a test mozgása, elsősorban a légzés szolgáltatja az energiát. A gyűjtőzsebekben visszanyer víz a nyaki csövön szívható ki. A sivatagban az emberek szűrőt viselnek az arcukon, a kilégzés azon keresztül megy.

dune.jpg

A szűrő mindenféle folyadékot újrahasznosít, a cirkóruha nagy előnye, hogy viselője vízszintjét külső forrás nélkül tudja feltölteni, tehát a legzordabb körülmények között sincs másra utalva.

Az ötlet ugyan sci-fiből ered, de oly sok sci-fi ötlethez hasonlóan, valóságos cirkóruha fejlesztésére ihletett személyeket. A The Hacksmith YouTube-csatorna mérnökei ugyanis elkészítették. Változatuk nem hasonlít az eredetire, de a valóságtól sincs annyira elrugaszkodva.

dune0.jpg

A tervezőknek sikerült megvalósítaniuk, hogy a ruha összegyűjtse a test verejtékét, viselője pedig egy csövön keresztül megigya a folyadékot. Termoelektromos hűtőt, számítógépet és más készülékeket elektromos töltés két különböző fémen történő átvezetésével hűtő, kis rácsos eszközt használtak hozzá. A készülék hideg oldala a ruhában maradt, és a beszorult levegőben – nem úgy, mint a párátlanító – magához vonzza a nedvességet.

Eközben egy ivóhólyag és a helyi sportszer-boltban vásárolt vízszűrő kombinációja összegyűjtötte a ruha viselése közben keletkező vizet, ami (inkább a nevettetés, meghökkentés kedvéért) csövön keresztül meg is iható. Éles helyzetben nyilván kevésbé megmosolyogtató.

Az egyetlen nap alatt összedobott csináld magad (Do-it-Yourself, DiY) megoldás természetesen nem tökéletes, és nem biztos, hogy elég lenne az Arrakis sivatagában.

A ChatGPT immáron Reddit-tartalmakhoz is legálisan férhet hozzá

A Reddit közösségimédia-szolgáltató bejelentette, hogy partnerségre lépett a GPT legújabb változatával, a GPT-4o-val május közepén debütált OpenAI-val. A szerződés értelmében a ChatGPT fejlesztővállalata mesterségesintelligencia-modelljeit a Reddit több tízmillió napi felhasználója által posztolt anyagokon (is) gyakoroltathatja.

Az egyezséggel a közösségi médium is jól jár, mert felhasználói és moderátorai számára az OpenAI MI-vel működtetett funkciókat hoz létre. Más szempontból szintén hasznos számára a deal: a bejelentés után a cég tőzsdei részvényei tíz százalékkal emelkedtek. Azaz, a Reddit a hirdetések mellett szélesíteni próbálja bevételi forrásait.

reddit_2.jpg

Az utóbbi hónapokban az OpenAI az Associated Press-szel és a Financial Times-szal is kötött hasonló szerződést.

2024-ben az MI-versenyfutás egy másik kulcsszereplője, a Google szintén megegyezett a Reddittel, ők is trenírozhatják mesterségesintelligencia-modelljeiket a közösségi médium anyagain.

A szerzői jogi problémák miatt, pereskedéseket megelőzendő, egyre gyakoribbak az ilyen szerződések MI-fejlesztőcégek és tartalomgyártók között. A korábbi gyakorlattal ellentétben, a modellek immáron legálisan használhatnak értékes online tartalmakat.

Az Egyesült Államokban és az Európai Unióban is sokan megkérdőjelezik, hogy MI-eszközök gyakoroltathatók-e jogvédett tartalmakon, illetve bizonyos kivételek vonatkoznak-e rájuk, és ha igen, akkor milyen mértékben.

Az USA-ban egymástól függetlenül több per folyik MI-fejlesztők (főként az OpenAI) ellen: George RR Martin, a Trónok harca szerzője, a színész Sarah Silverman és a New York Times egyaránt jogi úton próbálkozik.

A világ legnagyobb zenei kiadója, a Sony levelet írt a napokban a Google-nak, a Microsoftnak és az OpenAI-nak. Felszólította a cégeket, hogy tudassák velük, ha a Sony jogvédelme alá tartozó muzsikákat MI-rendszereik gyakoroltatására használják.

Szemmozgással irányítható az iPhone és az iPad

Az Apple az év második felében operációs rendszerein működő új hozzáférési funkciókat jelentett be. A cég szokásához híven, előzetesen nem nevezte meg az iOS18-at, de nyilván arról és más operációs rendszereiről van szó.

A Szemkövetés (Eye Tracking) lényege, hogy fizikailag korlátozott iPhone- és iPad-felhasználók szemmel irányíthatják készülékeiket. Elég lesz az okostelefonra vagy a tabletre nézni, és a Vision Pro VR/AR headsethez hasonló új IOS tekintet-rendszer működésbe lép.

apple_vezerles.jpg

A Szemkövetés az előlapi kamera segítségével határozza meg, mit néz a felhasználó a képernyőn. Így válik lehetővé a csak szemmel, érintés nélkül történő navigáció. Például ránézve egy gombra, kiemeljük azt, néhány másodpercig rajta tartjuk a tekintetünket, hogy a rendszer aztán kiválassza.

A szintén új Music Haptics (zenetapintás/érintés) siketeket és gyengén hallókat hivatott támogatni. Rendeltetése, hogy ők is úgy hallják és élvezzék a zenét, mint bárki más. Az iPhone haptikus motorját használva, játssza le az elhangzott muzsikával szinkronizálódó koppintásokat és finom rezgéseket.

A Vehicle Motion Cues a mozgásszervi betegségben szenvedő iOS-felhasználókat segíti, amikor iPhone-jukat vagy iPad-jüket utasként használják mozgó járműben. Ha a mozgásjelzők működésbe lépnek, a rendszer a jármű mozgását követő, animált pontokból álló mintázatot fed le. A funkció csökkenti az érzékszervi összeütközéseket az agyban, minimalizálja a mozgásszervi betegség érzetét.

Az úgynevezett Vokális Parancsikonokkal egyedi műveleti kifejezéseket rendelhetünk parancsikonok elindításához, bonyolult, többlépcsős műveletek végrehajtásához. Az agyi bénulásban, amiotrófiás laterális szklerózisban vagy stroke-tól szenvedő felhasználókat támogató „Atipikus beszéd figyelése” móddal pontosabb a diktálás és a beszédfelismerés.

Az Apple a hozzáférést javító több más kisebb megoldást szintén bejelentett.

Olyan erős volt a napvihar, hogy mezőgazdasági berendezések álltak le az USA-ban és Kanadában

Május második hétvégéjén az utóbbi két évtized legnagyobb napvihara rázta meg töltött részecskékkel a földi atmoszférát. Észak-Amerika és Európa jelentős részén látványos sarki fényt váltott ki.

Május 10-én és 11-én a vihar extrém, G5 kategóriás szintet ért el. Erőssége elegendő volt ahhoz, hogy pusztítást végezzen kommunikációs berendezésekben és az elektromos hálózatban.

napvihar0.jpg

Különösen negatív hatással volt egyes amerikai és kanadai mezőgazdák számára: traktoraik és más fontos munkaeszközeik az ültetési szezon kellős közepén rongálódtak meg. A vihar döbbenetes és ritka példa arra, hogy a kíméletlen űridőjárás bolygónk védőburka ellenére, milyen hatással lehet a Földre.

A GPS-en és más navigációs technikákon alapuló traktorok és így a magvetési munkák is leálltak. Egyes farmerek elmondták: soha nem láttak még hasonlót. Többeket előre figyelmeztettek, hogy GPS-rendszerük leállhat. A következő hétfőn meg is ugrottak az árupiacok.

napvihar.jpg

A John Deere mezőgazdaságigép-gyártó a GPS-t más szenzorikus adatokkal kombináló StarFire adóvevői különösen megrongálódtak, és a problémák továbbra is fennállhatnak. A „csökkentett pontosság” – a napvihar – idejében végzett vetés befolyásolhatja a következő hónapok munkáit (permetezést, vetést, betakarítást). Például a sorok nem ott lesznek, ahol az AutoPath funkció képzeli őket.

Mivel a Nap tizenegy éves ciklusának legaktívabb részébe lépett, az előrejelzések szerint 2024-ben több hasonló napvihart láthatunk még – kitörésekkel, kilökődésekkel, részecskék másfajta áramlásaival. Néhány farmer ironikusan meg is jegyezte, hogy legalább ingyen csodálhatta az Északi Fényt.

Tényleg halott az internet?

Már lehetetlen úgy navigálni az online térben, hogy ne futnánk bele botokba. Az utóbbi hónapokban – különösen az X-en, azaz az egykori Twitteren – árad az általuk generált tartalom, mondatok, nemlétező személyekről, eseményekről szóló képek, mozgóképek. Posztokra szintén özönvíz-szerű generált szöveg a válasz, legyen az a YouTube, a Facebook vagy a Reddit. Lassan már fel sem tűnnek, mert annyi a felhasználói élményt lerohasztó „botcsinálta” szöveg, virális kontent.

Az utóbbi években online chatfórumokban kezdték emlegetni a jelenséget leíró Halott Internet Elméletet. Lényege, hogy a mai közösségi média főként algoritmusok vezérelte, bot-fiókok közötti interakciókon alapul. Eközben nő a személyre szabott hirdetések és a spam mennyisége, szaporodnak a kamuhírek és kamu-honlapok, burjánzik az internetes csalás, és lassan már semmit nem tudunk anélkül megnézni, hogy ne futnánk bele keresetlen reklámokba, politikai agitációba. Szép lassan, ha nem is használhatatlanná válik a világháló, de nagyon meg kell szenvednünk a használatáért.

halottinternet.jpg

A nagy nyelvmodellek (LLM-ek) és képgeneráló MI-k térnyerésével romlik a helyzet. A rájuk alapuló botok betaníthatók a „virális” stílusra – milyen szavak, szókombinációk, képek terjednek legsebesebben –, és döbbenetes hatás érhető el velük. Népszerű anyagok jelennek meg kormányhivatalok felrobbanásáról, képzeletbeli divatirányzatokról, és egyiken sem szerepel, hogy valójában MI az alkotó.

A technológia fejlődésével a mélyhamisítványok minősége drasztikusan javul, bárki átverhető velük. Drámaitól a mindennaposig, a valótlanság rétegei vesznek körül, teremtik meg az internet anyagtalansága által tovább fokozódó helynélküliség érzetét. A generált tartalomhoz ráadásul ki is aknázzák a különböző platformok különböző algoritmusai adta, máshol és más közönségnek szóló lehetőségeit. De még ugyanazon a platformon is eltér a különböző közönségeknek szóló (botok által generált) tartalom. Trenddé vált, hogy egyes közösségimédia-algoritmusok a valóságnál szélsőségesebbnek, és ezzel izgalmasabbnak mutatnak a mind inkább visszhangszobákat belakó felhasználókat.

Sajtóintegritás nélkül minden forgalmat, figyelmet és bevételt generáló tartalom elsőbbséget élvez. Google-keresésekkor reklámok, nonszenszek szerepelnek előkelő helyen, és az óriáscég MI-szemét elleni – MI-vel vívott – harca eleve vereségre ítélt.

Az internet „halálának” paradoxonja, hogy már alig léteznénk, a fejlődés leállna nélküle, ugyanakkor egyre több kellemetlenséget, bosszúságot okoz. Eredetileg emberek összehozása, a világ egybekapcsolása volt a rendeltetése – ugyanaz, mint a nyelvnek. Ma viszont inkább hirdetési bevételek generálásáról, még több kattintásról szól. Azzal a tudattal navigálni, hogy a látott dolgok nagy része kamu, zárójelbe teszi a közösségi média eredeti rendeltetését. Senkit nem érdekel botok egymás közötti kommunikációja nemlétező személyekről, hamis képekkel. Információ és interakció helyett a viralitás és a profit a vezérlőelv ott, ahol életünk nagy részét leéljük. A net persze még mindezekkel együtt is hasznos és szükséges, viszont, mivel egyre intenzívebben tevékenykedünk ebben a térben, mindenképpen tennünk kell valamit azért, hogy élhetőbbé váljon. Például tudatosabban használjuk!

Mik a legjobb generatív MI-modellek a képzőművészetben és a designban?

A generatív mesterségesintelligencia-eszközök közül a képalkotó modellek az elsők között mozgatták meg a nagyközönség fantáziáját. A technológia és a piac fejlődésével kuriózumból hasznos és hatékony alkalmazásokká váltak. Ma már bejáratott művészeti és designplatformok integrálták a generatív MI-t. Céljuk nem az emberi kreativitás helyettesítése, hanem növelése. Rengeteg van belőlük, nehéz eligazodni közöttük. Melyek mégis a legjobbak? A tájékozódásban Bernard Marr jövőkutató friss anyaga segít.

Az OpenAI DALL-E modellje az egyik legmasszívabb és legrugalmasabb. Részletes promptokból pontos, szinte fotorealisztikus képeket, meglévő képekből új változatokat generál. A Microsoft a Bingbe, a Co-Pilotba és a Designerbe integrálta, de saját alkalmazásprogramozói felületén (API) is elérhető, azaz fejlesztők képgenerátort építhetnek saját alkalmazásaikba.

genai_muveszetek.jpg

Az amerikai Runway LM-mel együttműködő müncheni Ludwig Maximilian Egyetemen fejlesztett Stable Diffusion volt az egyik első képgenerátor MI. Egyetlen promptból számos képiterációt képes létrehozni, meglévő képeket módosít, ad hozzájuk új elemeket. Mivel nyílt forrású, bárki készíthet, futtathat lokálisan a hardverén saját változatokat. Filmektől, zenei videókig és televíziós műsorokig, sok területen használják, használatához viszont – rugalmassága miatt – nem árt némi technikai tudás.

A Midjourney inkább művészeknek, mint designereknek készült. Az output gyakran különleges hangulatú, álomszerű, fantasztikumba hajló, a szárnyaló fantázia terméke. Annyiban különbözik a többi modelltől, hogy nem webes interfészen, API-n vagy appon, hanem a Discord üzenetküldő platformon keresztül kommunikálunk vele. Pont a Discord miatt erős közösség épült köréje.

genai_muveszetek0.jpg

Az Adobe Firefly az Adobe Creative Cloud csomag része, olyan piacvezető programokat egészít ki generatív képességekkel, mint a Photoshop, az Illustrator és az Adobe Express. A Firefly-ban készített képek, tervek automatikusan integrálhatók profi design-munkafolyamatokba. Mivel a Firefly elkötelezett a transzparens és etikus MI mellett, a modellek gyakoroltatása főként az Adobe stockfotó-adatbázisában lévő, tehát jogtiszta képeken történik.

A népszerű felhőalapú Canva designplatformot marketinganyagok, email-sablonok és közösségimédia-eszközök alkotására használják. 2024-től, a Stable Diffusion egy „személyre szabott” változata jóvoltából generatív funkciókkal bővült.

A Google Imagenje nagyon jó eredményeket szokott elérni a „milyen közel van a képkimenet a felhasználó szöveges promptjához” megmérettetéseken. A Gemini Pro chatboton keresztül használható, de Európában egyelőre nem elérhető. Az Imagen-modellhez való hozzáférést az egyszerűbb Image FX (egy másik Google-eszköz) teszi lehetővé.

Fontos modellek még: Autodesk Fusion, Craiyon, DaVinci, Freepik, Getty Images AI (a Getty Images adattárából, Nvidia technológiával), az eredetileg csak írásra szánt Jasper, Let’s Enhance, NightCafe, Shutterstock AI (a stockfotó-szolgáltató anyagaiból), Wombo Dream (iOS-app).

Chipháború: az USA megtiltotta az Intelnek és a Qualcommnak, hogy chipeket adjon el a Huaweinek

Miután Joe Biden ebben a hónapban aláírta a TikTok kitiltásáról szóló törvényt – amennyiben a videó applikációt a kínai anyacég nem adja el –, újabb korlátozással folytatódik az Egyesült Államok és a Kínai Népköztársaság között évek óta tartó chipháború. Az USA kormánya a napokban ugyanis bejelentette, hogy visszavon egyes amerikai cégeknek adott engedélyeket, amelyek értelmében az országban készült chipeket értékesíthettek a kínai technológiai nagyágyú Huaweinek.

A Kereskedelmi Minisztérium nem pontosította, milyen engedélyeket vont meg, ám a chipgyártásban kulcsszereplőnek számító Intel és Qualcomm pontosította: néhány export licencükről van szó. A Huawei egyelőre nem reagált.

huawei.jpg

Az ellenségeskedés 2019-ben, Donald Trump elnöksége alatt kezdődött, amikor az USA korlátozta a „listázott” Huaweinek eladható technológiákat. Az amerikai vezetés a nagyvállalat és a kínai hadsereg közötti kapcsolatokkal indokolta a döntést. Egyes vállalatok, köztük az Intel és a Qualcomm engedményeket kaptak, így ők üzletelhettek a kínai vállalattal.

Amerikai cégeknek kormányengedélyre van szükségük egyes technológiájuk exportjához vagy transzferéhez. A kormány különösen attól tart, hogy a kínai hadsereg használhatja ezeket a technológiákat. Amikor az Intel és a Qualcomm megkapta a licencet, annyi volt a kikötés, hogy a termékek ne kapcsolódjanak az 5G-hez.

A kínai kormány – a külügyminisztérium – elítélte Washington az ország vállalatai ellen irányuló lépését. Szerintük túlzásba viszik a nemzeti biztonság kérdését, és visszaélnek az export kontrollálásával, amellyel indoklás nélkül büntetnek kínai cégeket.

Egyes amerikai döntéshozók a Huawei MateBook X Pro laptop piaci bevezetését követően bírálták a Biden-adminisztrációt. Republikánus kongresszusi képviselők szerint a mostani lépésre sem került volna sor az ő nyomásgyakorlásuk nélkül.

A Huaweit súlyosan érintették az Egyesült Államok kereskedelmi korlátozásai, de az utóbbi időben úgy tűnt, hogy visszatérnek a korábbi szintre. Különösen a Mate 60 Pro okostelefon augusztusi piaci bevezetését követően hihettük, mert akkor ismét beindulni látszott a szekér, aztán az USA mostani döntésének következményeként, lehet, hogy mégsem.

Hogyan változtatja meg a mesterséges intelligencia az egészségügyet?

Az egészségügy a mesterséges intelligencia egyik leglátványosabb és legnagyobb hatású alkalmazási területe. A képelemzés, radiológiai képek kiértékelése volt az első komoly áttörés, azóta az adminisztrációtól a gyógyszertervezésig ma már a gyógyítás számos szegmensében használják a technológiacsaládot.

MI nélkül nem lehetne automatizálni munkafolyamatokat. Az automatizációval leegyszerűsödik az adminisztráció, komoly terhet vesz le orvosok és ápolók válláról. MI-modell automatizálja a napi betegfelvételek kódolását, beszélgetéseket hasznos dokumentumokká alakít és így tovább.

mi_egeszsegugy0.jpg

A robotizáció is csak mesterséges intelligenciával megy, például léteznek és működnek már automatikus vérvételi eszközök. Először tartottak a páciensek negatív reakcióitól, az első tesztek azonban sikeresnek bizonyultak, megszűnt a félelem, pozitívan viszonyultak a technológiához.

Robotokat azonban nemcsak vérvételre használnak. Egy kínai gép fogbeültetésnél segédkezik. A Big Tech vállalatai humanoidokkal kísérleteznek: az Nvidia multimodális inputokkal gyakoroltatja őket, a Tesla Optimusa több funkcióra lehet alkalmas, az OpenAI és a Figure közös fejlesztésű kétlábú gépeit szintén bevethetik az egészségügyben.

mi_egeszsegugy.jpg

Szükség lesz rájuk, mert a kórházak és más intézmények személyzetének létszáma folyamatosan csökken. A robotokkal azonban több a feladat is: a befektetés mellett telepíteni, karban kell tartani, gyakoroltatni kell őket, és a tanuláshoz is plusztérre van szükségük.

Az MI a gyógyszeriparban, új gyógyszerek fejlesztésében szintén komoly szerepet fog játszani. A DeepMind AlphaFold algoritmusa kétszázmillió fehérje szerkezetét tárta fel egy év leforgása alatt. A fehérjék hajtogatási módja meghatározza, hogy mit tesznek, milyen más molekulákkal lépnek majd kapcsolatba.

A medicina egyik célja egyes molekulák blokkolása vagy stimulálása, ami a fehérjehajtogatás módszerének ismerete nélkül nem megy. Az utóbbi öt évtizedben, változatos technikákkal többszázezer fehérjeszerkezetet térképeztek fel.

Aztán jött a DeepMind AlphaFold modellje, és hatszázmilliónál több fehérjeszerkezet hajtogatásáról készített részletes előrejelzéseket. Sikere miatt az elvárások óriásiak, mert mesterséges intelligenciával gyorsabban, könnyebben és olcsóbban tesztelhetők ígéretes molekulakombinációk új gyógyszerekhez.

süti beállítások módosítása