Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Játék közben elnémíthatjuk a gyűlölködő beszólásokat

2021. április 26. - ferenck

Az Intel Bleep (szó szerint: „sípjellel kicenzúráz”) hangfelismerő eszközével chatek automatikusan moderálhatók, lehetővé válik, hogy leállítsuk a ránk zúdított szidalmakat, durva beszédet. Játékokra találták ki, egyelőre a bétaváltozatnál tartanak, azt viszont sikeresen tesztelték, még idén várható a kereskedelmi forgalmazás.

A chipgyártó a tartalommoderáló technológiákat fejlesztő Spirit AI-val dolgozott együtt az új eszközön. A felhasználók finomhangolhatják, hogy egy-egy hangalapú kommunikációból mennyi és milyen típusú durva beszéd jusson el hozzájuk.

haters.jpg

A Bleep a beszéddetektálást kombinálja össze a Spirit AI csúcstermékével, amely chatkörnyezetben határozza meg, hogy egy kifejezés, mondat stb. zaklatásnak számít, vagy sem.

A rendszer kilenc kategória, például a szexuálisan explicit nyelvezet, az LGBTQ-ellenes gyűlöletbeszéd, vagy a nőgyűlölet alapján ítéli meg, mennyire sértő egy szöveg. A felhasználók dönthetnek, hogy egyet sem, többet vagy mindegyiket kiszűrik. A tizedikre, az (afroameriaikra vonatkozó sértő) N-szóra, a rendszer szintén felajánlja az igen/nem választási lehetőséget.

haters0.jpg

A Bleep egyelőre Windows-PC-ken fut, és mivel közvetlen interakcióban áll a Windows audiokontrollal, sok hangalapú chatalkalmazással működik.

Mások szintén próbálkoznak a játékokban lévő hangkommunikáció, chat önkéntes moderálásával.

A ToxMod moderátoroknak kínál a sértő nyelvezet szervereken átívelő követésére alkalmas kezelőfelületet. A Hive rendszere audió, videó, szöveges és képi tartalmak szűrésére egyaránt alkalmas, egyik ügyfele például a nem kívánt meztelen fotóktól óvja meg az azokra nem kíváncsi felhasználókat. A Two-Hat megoldása a moderálást például szándékos helyesírási hibákkal megtévesztő próbálkozásokat mutatja ki.

A fejlesztéseket a hálózati kommunikáció védelme, a visszaélések és sértegetések nélküli interakció vágya teszi szükségessé. A Rágalmazásellenes Liga felmérése alapján az amerikai online gamerek 22 százaléka azért hagyott abba játékokat, mert verbálisan inzultálták őket.

De még mielőtt cenzúrát kiáltanánk, ne felejtsük el, hogy a moderálásról mi magunk dönthetünk.

Hogyan építsünk pontosabb kvantumszámítógépet?

Az Amazon felhőszámításokkal foglalkozó Amazon Webszolgáltatások (AWS) leányvállalata új kvantumszámítógép-architektúráról közölt tanulmányt. Ha sikerül megvalósítaniuk, a hibakorrekció új szabványát jelentheti.

A gép egyelőre teljesen elméleti, viszont újfajta módszerrel irányítja a kvantumbiteket (qubiteket), így garantálva a lehető legpontosabb számításokat. Az anyagra valószínűleg sokan felkapják a fejüket, mert a kvantum hibakorrekció (QEC) a terület egyik leggyorsabban megoldandó problémája. Amíg nem sikerül, nehéz lesz hatékony kvantumszámítógépek fejlesztése. A mai rendszerek ugyanis hemzsegnek a hibáktól.

A qubitek sajnos nagyon instabilak, és a kvantumállapotuk külső környezetben azonnal összeomolhat, és így a számítások sem megbízhatók. Sok kutató dolgozik a hibadetektálás és a korrekció hatékony módszerein.

amazon_quantum.jpg

Kvantumalgoritmusokhoz többmillió vagy milliárd kvantumkapu kellhet, ezek a kapuk az alapjaik. Jelenlegi állapotukban viszont hajlamosak hibázni. A hibaráta ugyan csökken, de még mindig nagyságrendekkel több, mint amennyit egy megbízható algoritmus „elbír.” További csökkentésükhöz a fizikai szinten is új megközelítéseket kell alkalmazni.

A hagyományos módszer, az aktív QEC sok „nem tökéletes” vagy „fizikai” qubittel javítja ki a hibásnak azonosított qubitet, visszaállítva a részecske pontos állapotát. Az így létrehozott, irányítható qubit a logikai qubit.

Az aktív QEC azonban komoly hardverteljesítményt igényel. Mivel minden egyes logikai qubit kódolásához sok fizikai qubit szükséges, a masszív qubit áramkörökből álló univerzális kvantumszámítógép felépítése rendkívül nehéz feladat.

A passzív QEC megközelítés hibákkal szembeni stabilitással rendelkező fizikai számítási rendszer építésére összpontosít. E munkák zöme egyelőre csak a kísérleti szakasznál tart, a módszerrel viszont megteremthető a belső hibatűrés, amellyel felgyorsulna a nagymennyiségű qubitet tartalmazó kvantumszámítógépek fejlesztése.

Az AWS kutatói a két módszert kombinálva vázolták fel az elvileg pontosabb gépet. A rendszer passzív QEC formán alapul, a qubiteket oszcillátorban tartják a szuperpozíció állapotában, miközben a kvantumállapot fenntartására, fotonpárokat tesznek bele, vonnak ki belőle. Bizonyos hibatípusok ritkábbak, míg mások korrigálása passzív és aktív QEC technikák szigorúbb kombinációival érhető el.

Az eredmények bíztatóak, ám az elméleti architektúra fizikai eszközre alkalmazása előtt több kihívást meg kell még oldani. Az AWS mindenesetre úgy tűnik, felgyorsítja a fejlesztéseket, amely jelzés is egyben: az IBM, a Google, a Microsoft és mások mellett az Amazon is részt vesz a kvantum-versenyfutásban.

Mesterséges intelligencia fejti meg a kínai nyelv rejtelmeit?

A Pekingi Mesterséges Intelligencia Akadémia az általa együtt Wu Dao-nak nevezett négy különleges nyelvi modellt ismertetetett. A modelleket az ország vezető egyetemeinek és technológiai cégeinek a kutatói fejlesztették. A tudósok elmondták, hogy mind a négy sokat segíthet a kínai bürokráciában való eligazodásban, például a Pekingi Motorjárművek Hivatalával folytatott ügyintézésben.

A következőkről van szó:

A 2,6 milliárd paraméteres Wen Yuan kínai és angol nyelvi feladatokban vagy elérte, vagy túlszárnyalta a világ legismertebb modellje, a GPT-3 teljesítményét. A fejlesztők terve, hogy idén átméretezik, maximum 100 millió paraméterre csökkentik.

chinese0.jpg

A Wen Lan képekhez és videókhoz társít szöveget. A tanulóalgoritmussal a kutatók 50 millió kép-szöveg páron gyakoroltatták a modellt. Jelentős részük negatív példa, rossz adatcímke volt. Wen Lan a kép-szöveg vizsgálatban az eddigi legjobb modellnél is eredményesebben vizsgázott, 5 százalékponttal vert rá.

A szöveget generáló, 11,3 milliárd paraméterrel dolgozó Wen Hui általános nyelvi készségeket sajátít el. Szöveges útmutatások alapján verseket író, videókat és képeket létrehozó alkalmazásokat találtak ki hozzá.

chinese.jpg

A speciálisabb Wen Su emberi vérsejtekből vagy gyógyszerekkel szemben ellenálló baktériumokból következtet biomolekulák, például protein és DNS formájára.

A projekt újítása még az 1 trilliónál több paraméteres modellek gyakoroltatására kitalált FastMoE és egy kínai nyelvű adatbázis is.

A kínai kormány támogatásával 2018-ban alapított Pekingi Mesterséges Intelligencia Akadémia rendeltetése, hogy segítsen az ország globális MI-központtá válásában. Az intézmény más projektjeinek keretében ideghálók kognitív gyökereit vizsgálják, szabványosított MI jelmagyarázatokon dolgoznak, MI-specifikus chipeket fejlesztenek. A nyelvi modellek kidolgozása tökéletesen illeszkedik ezekhez a kezdeményezésekhez, az elképesztő (már-már felfoghatatlan) számsorok pedig önmagukban sokat elárulnak a modellek hatékonyságáról, és hogy mit is jelent a big data.

Videojátékos majom Elon Musk laboratóriumában

Elon Musk agy-számítógép interfészen (Brain-Computer Interface, BCI) dolgozó cége, a Neuralink múlt héten különös videót mutatott be: egy makákó majom az ősrégi videojáték Pongot játszotta. A számítógépet elméjével kontrollálta, irányította.

„Gondolati úton, agyába ültetett chip közvetítésével játszik” – nyilatkozta róla Musk.

neuralink0.jpg

A kilencéves majom agyának mindkét oldalára egy-egy eszközt kapcsoltak. A Link nevű szerkezet az idegsejtek tevékenységét rögzíti, miközben az állat interakciókat folytat a számítógéppel. Ezt a karok mozdulataiért részben felelős motorikus kortexbe implantált, nagyon pici elektródák teszik lehetővé.

A makákó megtanulta a joystick használatát, hogy hogyan mozgassa a kurzort a célpontra, amiért banánt kapott jutalmul.

neuralink.jpg

Az adatokat dekódoló algoritmusba táplálták, hogy valósidőben előre lehessen jelezni a majom kézmozdulatait. Mihelyst kalibrálták a dekódert, már nem a joystickkel, hanem gondolataival irányította a kurzort. (Előbbit egyébként ki is kapcsolták.)

A kísérlet ugyan látványos, de nem új. Az ötletet az 1960-as években felvetették, majmok pedig már a 2000-es évek elején tudtak agyukkal mozgatni kurzorokat. Az elképzelést 2006 óta tesztelik emberekkel. A tudományos közvélemény mindenesetre részletes, magyarázó tanulmányt is vár a videó mellé.

A legnagyobb újítás, hogy a bőrön nincsenek kábelek, az agy és a gép kommunikációja vezeték nélkül történik. Ezekkel a lépésekkel az emberen történő alkalmazások is biztonságossá válnak, és az állatkísérletek sem olyan kíméletlenek, mint voltak régebben.

A Neuralink augusztusban három disznóval tartott technológiai bemutatót. Egyikük, Gertrúd interakcióba lépett a számítógépes rendszerrel, agya jelzéseket küldött. A cég mindezekkel az emberi agy és a számítógépek közötti információáramlást akarja felgyorsítani. A technológia ugyan gyerekcipőben jár még, de bizakodnak, hogy mozgássérült személyek hamarosan az elméjükkel működtetnek majd komputereket.

Musk elmondta, hogy első termékükkel őket célozzák meg; okostelefonos alkalmazás lesz. Sokan viszont a személyes szférát (privacy) féltik, mert szerintük a technológiával akár a gondolataink is kiárusíthatók.

Robot felügyeli a hegesztő robotokat

Egyre kevesebb a képzett és ügyes munkafelügyelő. Nehéz rájuk találni, de ha sikerül is, alkalmazásuk nagyon drága, ráadásul nem mindig képesek átlátni egy robothegesztőkkel teli gyár összes szegletét. Következményként a hibák mindaddig észrevétlenek maradnak, amíg egy kisebb darab része nem lesz a nagyobb szerelvénynek.

Egyetlen hegesztett darab akár tízezer dollárba is kerülhet, tehát az észrevétlen hibák komoly anyagi következményekkel, veszteséggel járhatnak. Ha időben észlelik őket, idő és pénz spórolható meg. Manapság gépilátás-rendszerek segítenek ebben.

robothegeszto.jpg

Terjedőben a mesterséges intelligencia által működtetett minőségbiztosítás. Az olyan rendszerek, mint például a Landing AI egyre inkább és egyre nagyobb számban felismerik a gyártófolyamat közbeni hibákat.

E tendencia részeként, robotfelügyelők átnézhetnek a hegesztő robotok válla felett, és látják, hogyan dolgoznak a gépek.

robothegeszto0.jpg

A mezőgazdasági csúcsgépeket, például high-tech traktorokat gyártó amerikai John Deere gépilátás-rendszert fejlesztett hibák észlelésére. A rendszer abban segít, hogy nehéz masinái működésre kész állapotban kerüljenek le a gyártósorról.

Más gyártókhoz hasonlóan, a John Deere is hegesztő robotokat használ fémrészek összeillesztéséhez. Az elkészült gépek a farmoktól az erdőgazdálkodásig, vagy éppen az építőiparig, változatos területeken kerülnek alkalmazásra.

Csakhogy az ipari mértékű hegesztéssel régóta van egy komoly probléma. A készülőben lévő szerkezet belsejében, gázbuborékok keletkezhetnek. Hűlés közben a buborékok „legyengítik” az adott részeket. Az Intel például azért fejlesztett cselekvésfelismerő modellt, hogy valósidőben észrevegye a gyártás közbeni hibákat.

A John Deere modelljét jól és kevésbé jól sikerült hegesztésekről készült videókon gyakoroltatták. Mivel fényeket kizárólag a hegesztőpisztoly adott, a fényviszonyok nem befolyásolták a modell teljesítményét. A hegesztőpisztolyon lévő robusztus kamerára helyezve, 30-35 centiméterről látja a megolvasztott fémet.

Ha hegesztési hibát észlel, leállítja a hegesztő robotot, és azonnal értesíti a humán dolgozókat.

Cicának látja a békát a mesterséges intelligencia

Köztudott, hogy a gépi tanuláshoz használt adatsorokban találhatók hibák. A problémával foglalkozó korábbi vizsgálatok inkább a gyakorlásra, és nem az adatsorokra összpontosítottak. Megállapították, hogy a mélytanuló-rendszerek teljesítménye nem romlik, ha a címkéknek csak kis része pontatlan.

Két fontos tényt azonban figyelembe kell venni. Egyrészt, a hibákban bővelkedő tesztsorok nem igazi mércéi egy modell adottságainak, másrészt, a hibás címkék aránytalanul nagyobb mértékben befolyásolják a méretesebb modelleket.

errors0.jpg

Sajnos, több referenciaként kezelt adatsorban is akad bőven hibás címke. Számszerűsítve, a tíz leggyakrabban használt 3,4 százalékáról van szó – derül ki két MIT- (Massachusetts Institute of Technology) és egy Amazon-kutató közös tanulmányából. Kiemelik, hogy a rossz címkék negatív hatása a modellek méretének növekedésével párhuzamosan nő.

A legnépszerűbb adatsorok, köztük az ImageNet, az Amazon Reviews és az IMDB hibás címkéinek azonosítására gyakoroltattak be egy modellt. Egy rossz címke két kritériumnak tesz eleget: ha a modell előrejelzett osztályozása nem felel meg a címkének, és ha a modell osztályozásba vetett bizalma nagyobb volt, mint a címkézett osztály előrejelzésével kapcsolatos átlagos bizalma.

errors.jpg

A rosszul címkézett példákat humán „bírálók” is átnézték. Sok egyértelmű hibát találtak, például közönséges békára sütötte rá az MI, hogy macska, vagy egy énekes hanganyagára, hogy fütyörészés, negatív filmkritikákra, hogy pozitív, és így tovább. A QuickDraw idegháló dolgozott a legtöbb, (10,1 százalék), az MNIST a legkevesebb (0,15 százalék) pontatlanul felcímkézett anyaggal.

A kutatók kijavították a címkéket, majd korrigálták a tesztsorokat. Ezt követően mérték, hogy különböző modellek hogyan osztályozták a módosított adatsorokat. A kisebbek sokkal jobban teljesítettek, mint a nagyobbak.

Arra a következtetésre jutottak, hogy a mesterségesintelligencia-fejlesztéseknél ideje lenne a modellközpontú megközelítésről adatközpontúra váltani. Sok csúcsmodell elég jó már ahhoz, hogy az architektúrájával való bíbelődés kevés előnyt hoz, a teljesítmény növelésének legjobb módja viszont egyértelműen a tanulóadatok minőségének feljavítása.

Jobban érezze a robot ember munkatársai jelenlétét!

A biztonságos munkavégzés nemcsak folyamatokon, hanem a kontextuson, a környezet és a feltételek megértésén, a többi dolgozó következő lépésének előrejelzésén múlik.

Hongyi Lin, a svéd KTH Királyi Technológiai Intézet kutatója robotokat környezetük jobb érzékelésében segítő rendszert dolgozott ki. Célja, hogy hatékonyabban, szükségtelen megszakítások nélkül együtt tudjanak dolgozni a mellettük lévő emberekkel.

A rendszer a robot és az ember közötti távolság megítélése mellett azonosítja, hogy ki min dolgozik, és az emberek csontvázmodelljét, tömegét is felbecsüli. Ezeknek az információknak a birtokában felismeri a dolgozók testtartását, amiből következtetést von le. Így pontosabban érzékeli a környezetet, miközben interakciót folytat a munkatársakkal.

robotkontextus.jpg

A mesterséges intelligenciával működő rendszerhez kevesebb számítási kapacitás és kisebb adatsorok kellenek, mintha valamelyik hagyományosabb gépitanulás-módszert használná. A rendszer az úgynevezett ismeretátadáson (transfer learning) alapul, a működő modellként történő adaptálása előtti gyakorlás során szerzett ismereteket hasznosítja újra.

Lin elmondta, hogy a technológia nemcsak megfelel a biztonságos ember-robot együttműködés nemzetközi szabványainak, hanem jobb is azoknál, már csak az iparban kellene alkalmazni. Ráadásul a „kontextus-tudatosság” nagyobb hatékonyságot garantál, mint a mostani egydimenziós dolgozó-robot interakciók sora.

A jelenlegi szabványok és technikai specifikációk alapján, ha ember közelít robothoz, a robot lelassítja magát, majd ha elég közel vannak egymáshoz, leáll. Ha az illető eltávolodik, a gép folytatja korábbi tevékenységét. Lin szerint ez nagyon alacsony szintű kontextus-tudatosság: „hátráltatja a hatékonyságot, a gyártás lelassul, emberek nem dolgozhatnak közvetlenül robotok mellett.”

Rendszerét a közlekedési jelzőlámpák vörös fényének időtartamát ismerő, és az alapján cselekvő önvezető autókhoz hasonlítja, amelyek kiszámítják, hogy fékezés helyett esetleg lassítani, vagy gyorsítani jobb.

Az eddigi kísérletekből kiderült, hogy az új rendszerrel feljavított robotok a gyártás lassítása nélkül is biztonságosabbak, hatékonyabbak.

Ideghálók keltenek új életre régi dalokat

Sok értékes zenei felvétel minőségét lerontják, torzítják a zajok, például a közönség tapsa vagy hangos éljenzése, esetleg a sziszegő analóg szalagok. Az előadók munkája így nemcsak nehezebben élvezhető, de nehezebben is értelmezhető. Más anyagokon pedig érződik az idő, hogy több évtizede, akkori technikával lettek felvéve.

A mesterséges intelligencia változtathat rajtuk – javít a zenei minőségen, új távlatokat nyit meg a jelen és a jövő alkotóinak.

zene_ideghalok.jpg

Ideghálókkal ugyanis elválaszthatók egymástól a zenei felvételeken felcsendülő hangok. Egyes cégek és hobbisták előszeretettel használják is a mélytanulás (deep learning) technikákat hangszerek és énekhangok elkülönítésére.

A folyamattal javítható régi felvételek minősége, másrészt új lehetőség nyílik a hangminta-vételre (sampling), mixelésre és más technikák alkalmazására.

zene_ideghalok0.jpg

Felvételeknél gyakran úgynevezett többsávos (multitrack) formátumban, kevesebb hangcsatornára, például egyet monóra és kettőt sztereóra keverik össze az éneket, a hangszereket és más hangokat.

A jelek összekeveredése korlátozza a hangegyensúly későbbi megváltoztatását. Eddig legalábbis így volt, a mai ideghálók viszont már megtanulták, hogyan válasszanak szét hangokat. A zajokat és a torzításokat is tudják kezelni, így a többsávos felvételhez való hozzáférés nélkül is képesek eltüntetni azokat, újabb hangegyensúlyt hoznak létre.

A londoni Abbey Road Stúdió egyik hangmérnöke által alapított Audio Research Group mélytanulással keverte újra – remixelte – a Beatles She Loves You számát. Az eredeti dalt többsávos felvétel nélkül készítették el.

A technológia élharcosa, a Párizs- és Los Angeles-székhelyű Audionamix mesterséges intelligenciája monó felvételeket ének-, dob-, basszusgitár- és más hangcsatornákra választ szét. A szolgáltatást régi felvételek reklámokhoz való alkalmazására, televíziós alkotások és filmek hanganyagának a háttérzenétől való megtisztítására használják. Így például a háttérben hallható zenedarabok kötelező és drága engedélyeztetésére sincs szükség, mert eltűnnek az új anyagról.

A Deezer francia zenestreamelő szolgáltató által ajánlott nyílt forrású Spleeter szétszed felvételeket, amellyel sokat segít a hangokat tetszés szerint újra összemixelő, felesleges zajoktól megtisztító, egyedi dalokká alakító felhasználóknak.

Arctalanítják a hatalmas kép-adatbázist

Az ImageNet a világ egyik legnagyobb kép-adatbázisa, tökéletes terep tárgyazonosító, arcfelismerő és más vizuális mesterségesintelligencia-szoftverek, algoritmusok tesztelésére. A projekt vezetői eldöntötték, hogy a személyiségi jogok (privacy) védelmében, elmosódottá teszik az összes fényképen látható emberi arcokat.

A lépés azért is szükségszerű, mert a képek az illető személyek beleegyezése nélkül kerültek a gyűjteménybe. A gigantikus adatbázisok, adatsorok korában ugyanis egyszerűen lehetetlen minden alanytól begyűjteni a használathoz szükséges hozzájárulást.

imagenet.jpg

Az utóbbi hetekben tesztelték, hogyan működnek a módosított képeken gyakorló modellek. Többféle felismerő feladatot kellett végrehajtaniuk.

Az Amazon Rekognition platformjával dolgozó kutatók közel 1,5 millió képen kerestek arcokat. A program elhatároló keretet tett az 500 ezernél több arc köré, ráadásul egyes képeken egynél több arc volt látható.

Közösségi közreműködéssel (crowdsourcing) toborzott önkéntesek ellenőrizték a modell munkáját, és ha kellett, korrigálták a hibákat. A kutatók ezt követően speciális technikával elhomályosították a kereten belüli arcokat.

imagenet0.jpg

Az eredeti ImageNet anyagokon és a módosított másolatokon huszonnégy képfelismerő rendszert gyakoroltattak. A különbség minimális volt, a megváltoztatott képeken dolgozó rendszerek átlagban alig egy százalékkal teljesítettek gyengébben. Az archoz jellemzően közeli tárgyak, például maszkok vagy harmonikák esetében viszont már jelentősen romlott a teljesítményük (-8,71, illetve -8,93 százalék).

Az elhomályosított vizuális adatok tanulásátadásra (transfer learning) gyakorolt hatását előre trenírozott modellekkel vizsgálták. Módosított és nem módosított képeket használtak, a modelleket tárgy-, jelenetfelismerésre, tárgydetektálásra és arcjegyek osztályozására finomhangolták. Az utóbbi arra vonatkozik, hogy az adott személy mosolyog, vagy sem, szemüveget visel, vagy sem, és így tovább. A módosított képeken dolgozó modellek nagyjából ugyanolyan eredményt értek el, mint az eredeti ImageNet anyagokon gyakorlók.

Jelenleg nagyon úgy tűnik, hogy az elhomályosított arcképes ImageNet lesz az új hivatalos változat.

A kutatás a személyiségi jogok nagyobb védelmét célzó széleskörű törekvés része. Tanulmányok szerzői évek óta javasolják rendszámtáblák és arcok elhomályosítását a Google Street View anyagain, önvezető járművek és cselekvéseket felismerő modellek gyakorlóadatain.

Mivel a gépi tanuláshoz használt adatsorok nem sérthetik meg a személyiségi jogokat, az azokat védő, ugyanakkor jó modellek gyakoroltatására alkalmas adatsorok kidolgozására van szükség. Pontosságuk valamelyest romolhat, de a minimális vesztség nincs arányban magánszféránk esetleges megsértésével. Egyébként az ImageNeten gyakorló legtöbb alkalmazás mindaddig a korábbiakhoz hasonló pontossággal fog működni, amíg nem az arcokhoz közeli tárgyakat kell azonosítaniuk. A problémán az adatok engedélyezett finomhangolása, azaz a képeken látható személyek hozzájárulása segíthet.

Megfogadják-e az orvosok a mesterséges intelligencia tanácsait?

Egyre jobban terjed, az Egyesült Államokban és máshol is széles körben elfogadott a mesterséges intelligenciák diagnosztikai használata. Klinikai kimenetek előrejelzésénél ezek az eszközök elvileg ugyanolyan jól működnek, mint a hagyományos megoldások.

Egyes orvosok mégsem bíznak a mesterségesintelligencia-rendszerek véleményében – derül ki az MIT (Massachusetts Institute of Technology) és a német Regensburg Egyetem közös felméréséből. A kutatók azt vizsgálták, hogy orvosok hogyan reagáltak gépitanulás-modell és humán szakértő diagnosztikai tanácsaira.

Az önkénteseknek mellkasi röntgensugaras felvételeket kellett diagnosztizálniuk.

medicine.jpg

Két csoportból álltak: az elsőbe tartozó 138 radiológus nagyon komoly tapasztalattal rendelkezett a röntgenes vizsgálatok értelmezésében, a másik, azaz 127 belgyógyász vagy sürgősségi specialista kevésbé.

Minden egyes esetben pontos vagy pontatlan tanácsokat kaptak, és megmondták nekik, hogy MI, vagy humán szakértő adta azokat. A tanácsokat pontozniuk kellett, majd saját diagnózissal álltak elő.

Az eredményekből kiderül, hogy a radiológusok gyengébb minőségűnek tartották az MI meglátásait, míg a másik csoport nagyjából egyformán értékelte a gépi és az emberi tanácsokat.

Ha pontos tanácsokat kaptak, akkor a forrástól függetlenül, mindkét csoport pontosabban diagnosztizált, pontatlan tanácsoknál viszont a radiológusok 27, a kevesebb röntgenrutinnal rendelkező kollégáik 41 százaléka hibás diagnózist készített.

A felmérés tanulsága, hogy nem elegendő, ha a használati környezettől függetlenül, attól izolálva fejlesztenek orvosi MI-rendszereket. Nagyon fontos megérteni, hogy a szakemberek hogyan használják őket. Még a világ legjobb diagnosztizáló algoritmusaival sem megyünk sokra, ha az orvosok nem bíznak bennük, nem hallgatnak a tanácsaikra.

Egyesek szkeptikusak velük szemben, mások szinte mindent elhisznek nekik – mindkét megközelítés hibákhoz vezethet. A kétely és a bizalom közötti egyensúlyt kellene megtalálni.

süti beállítások módosítása