Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Százezer gyomot pusztít el óránként a farmrobot

2021. április 30. - ferenck

A mezőgazdaság automatizálása, robotika és mesterséges intelligencia, az okos technikák elterjedése a szektorban az utóbbi évtized egyik meghatározó trendje volt. A tendencia folytatódik, az agráriumban egyre több az infokommunikációs megoldás.

A terület forradalmasításának egyik élharcosa, az intelligens gépeket fejlesztő, seattle-i Carbon Robotics bemutatta harmadik generációs Autonóm Gyomlálóját, a gyomokat azonosító és nagyon hatékony lézerrel elpusztító mezőgazdasági robot harmadik generációját.

A gyomok folyamatosan viaskodnak a többi növénnyel térért, napfényért, a talajban lévő tápanyagokért. Megkönnyítik a kártékony rovarok tevékenységét, hogy megfertőzzék, elpusztítsák a termést. Ellenőrzésük a mezőgazdák egyik legfontosabb feladata.

farming_robot.jpg

Elpusztításukhoz a gyomirtó vegyszerek sokáig tűntek hatékony módszernek, csakhogy más növényekben is komoly károkat okoznak, mérgezik a vizeket, és a talajt is károsítják. Másik megoldás, ha a farmerek kézzel végzik a munkát, ami egyrészt kellemetlen és fárasztó tevékenység, másrészt a szektorban tapasztalható munkaerőhiány évről évre súlyosbodó probléma. Mezőgazdák gyakran panaszkodnak: egyre nehezebb idénymunkásokat találniuk.

Ezeket a gondokat oldhatja meg az Autonóm Gyomláló. Tevékenységével sem a talajban, sem a vízben nem okoz kárt, és mivel automata módban dolgozik, munkakörére a mezőgazdáknak sem kell felvenniük senkit.        

Kicsit úgy néz ki, mint egy kerekekre rakott nagy kocka. Miközben magát vezeti a terménysorokban, tizenkét kamerája folyamatosan pásztázza a földet és a növényeket. Mesterséges intelligenciával működő fedélzeti számítógépe azonosítja a gyomokat, amelyeket lézerrel irt ki.

Óránként százezernél több gyomot képes elpusztítani, naponta tizenöt-húsz hektárt gyomtalanítani. Összehasonlításként: mezőgazdasági munkások általában napi egy hektárral boldogulnak.

A gép nem olcsó, egyelőre nem tudni az árát, de többszázezer dollárba kerülhet. A Carbon Robotics szerint a befektetés két-három éven belül térülhet meg. Sok mezőgazdasági robot sajnos nagyon drága, a gyomlálóból viszont idén már nem lehet rendelni, mert annyi a foglalás.

A boldog kevesek már használják is, és nagyon elégedettek vele.

„Farmerként, ez az egyik leginnovatívabb és legértékesebb technológia, amit valaha láttam” – nyilatkozta egy új-mexikói gazda, majd hozzátette, hogy a robotok mainstreammé fognak válni a szektorban, mert a mai mezőgazdaság több égető problémájára, például a vegyszerek túlzott használatára, a nem elég hatékony munkafolyamatokra, a munkaerőhiányra megnyugtató megoldást kínálnak.

Jobb lesz a videókeresés?

A videó keresőmotorokat gyakran egy-egy videó rangsorolása alapján értékelik ki. Az adott anyagot rövid leírás kíséri a tesztsorban. Ez a feltétel viszont nem biztos, hogy pontos képet ad a rendszer valódi környezetben játszott szerepéről, hogy mennyire hasznos olyankor, amikor nem egy, hanem sok videó felel meg a keresési kritériumoknak.

A Bristol Egyetem kutatóinak munkája, az új mércének, szintnek javasolt Szemantikus hasonlóság-alapú videokinyerés (SVR) megoldhatja a problémát. Az SVR sok hasonló videó rangsorolása alapján értékeli ki a keresőket. A kutatók maguk is fejlesztettek egyet, amely egyébként nagyon jól teljesített.

videokereses.jpg

A hasonlóság-alapú kiértékeléshez magához a leírások és a videók közötti hasonlósághoz kell nagyon pontos mértéket találni. Az összehasonlításhoz nincs automatikus módszer, a leírások viszont többféleképpen összehasonlíthatók.

A kutatók először a rendelkezésükre álló leírások közötti hasonlóságokat értékelték ki, hogy aztán egyáltalán belekezdhessenek a leírások és a videók összehasonlításába. Így vált lehetővé rendszerük gyakoroltatása, amely több videóhoz társított szöveget rangsorolt, majd a keresési eredményeket is kiértékelte.

videokereses0.jpg

A leírásokhoz és a videókhoz külön reprezentációkat generálva, a kutatók tovább finomították a hasonlóságokat. Felirat alapján a rendszer megtanulta a pontosabb rangsorolást, hogy mely anyagoknál passzol leginkább a videó- és a szöveges reprezentáció (és persze fordítva is: a szöveg mikor kapcsolódik a mozgóképanyaghoz).

Film-, híradó- és más forrásokkal végezték a teszteket. Ha a hasonlóság meghaladta a megadott küszöbértéket, akkor a leírás megfelelt a videónak. A rendszer a leírások reprezentációját létrehozó nyelvi modellel és videóreprezentációkat generáló ideghálóval dolgozott együtt. A hasonlóságokat és az eltéréseket egyaránt jól kezelte, és a videókat is pontosabban rangsorolta, mint a korábbiak.

A kutatók azzal is újítottak, hogy egy, már bevált tesztet sikeresen elvégző rendszer helyett, az ezekhez a rendszerekhez jobban passzoló tesztet dolgoztak ki. Megközelítésük a jövőben hasznosabb rendszereket eredményezhet.

A kutatás tanulsága, hogy a gépi tanulás fejlődésével egyre több új mércére lesz szükség, mert különben nem tudjuk pontosan követni és mérni az állandó újításokat.

Elveszett festményeket támasztanak fel az ideghálók

Ideghálók nemcsak új képeket generálnak, hanem évszázadok óta elveszettnek hitt festmények megtalálásában, restaurálásában is részt vesznek, például az Oxia Palus brit startup mesterséges intelligenciájának rendeltetése elveszett műalkotások feltámasztása. A munkához mélytanulást (deep learning) és 3D nyomtatást használnak, így keltettek életre egy Picasso festmény mögé rejtett képet.

Kutatók 2018-ban röntgensugaras technikával kimutatták, hogy az 1902-es Kuporgó nőt a művész más műalkotásra festette. Művészettörténészek szerint a barcelonai parkot ábrázoló másik kép Picasso kortársának, Santiago Rusiñolnak a munkája.

oxia_1.jpg

Az Oxia Palus vezetője és főmérnöke a röntgenkép alapján elkészítette a rejtett festmény fekete-fehér kontúrjait, majd a képfelületet épített szerkezetekre, zöldre és az égre bontották fel. Utána Rusiñol egy másik festménye alapján mesterséges ideghálójuk meghatározott részeket a festő stílusában alkotott újjá. Az eljárást stílustranszfernek hívják.

oxia0.jpg

A művész ecsetvonásait más képein használt speciális technikával utánozták. Szürkeárnyalatú változatot készítettek, amelyet a festmény „domborzat-térképére” alkalmaztak. Az így generált képet és a domborzat-térképet egy 3D nyomtatócéggel közösen printelték ki, pontosabban „printelték egybe.”. A fakszimile létrehozásánál különösen arra ügyeltek, hogy a festékrétegek alatt ne károsodjon a vászon.

oxia1.jpg

A másolatvédelem miatt minden egyes printhez egyedi kódot generáltak, a tervek szerint a Parc Del Laberint D’horta című festményből száz sorszámozott darabot értékesítenek.

A stílustranszfer módszer korábbi változatát egy másik Picasso-alkotás, Az öreg gitáros mögé rejtett női portré „újraélesztéséhez” használták. Legutóbb generatív ellenséges hálózatokat (generative adversarial network, GAN) gyakoroltattak Leonardo da Vinci és tanítványai 225 festményén, hogy feltámasszák a Sziklás Madonna mögötti képeket.

Későbbi műalkotások mögé rejtett anyagok sok mindent elárulhatnak, például hogy az adott festő milyen eredeti ötletből indult ki. Érdekes képet kaphatunk így alkotói folyamatokról, az adott korról. A stílustranszfer és a 3D nyomtatás összekombinálása komoly eszközzé válhat művészettörténészek számára.

MI 100: a szakterületet és az ipart újradefiniáló startupok százas listája

A technológiai ipart elemző CB Insight közzétette ötödik éves listáját a száz legígéretesebb mesterségesintelligencia-fejlesztő privát startupról. A trend egyértelmű: a koronavírus-járvány ellenére is virágzik az MI, egyre több és innovatívabb cég tűnik fel.

Hiába világméretű a gazdasági válság, a terület prosperál. Az MI hatása egyértelműen globális, az érintett vállalatok nagy többsége mégsem szétszórtan mindenfelé, hanem az Egyesült Államokban található.

A százat 6 ezres listáról válogatták ki. A válogatásnál olyan kritériumokat vettek figyelembe, mint a befektetők száma és típusa, kutatásfejlesztési tevékenység, versenyképes környezet, a cégekről szóló ismertetők.

aitop.jpg

A százaknak valamivel több mint a fele kínál gépitanulás-szolgáltatást, gépitanuló-rendszerek működtetését, azaz a mostani MI alapjait. A többiek tizennyolc iparágat képviselnek, leginkább az egészségügyet, a szállítást, a kereskedelmet és a logisztikát.

2010 óta összesen 11,7 milliárd dollárnyi támogatást kasszíroztak be. A legtöbb befektetésre, 1,6 milliárdra a kínai chipfejlesztő Horizon Robotics, az önvezető járművekkel foglalkozó amerikai Aurora (1,6 milliárd) és a szintén autonóm közlekedési eszközökön dolgozó kínai Momenta (783 millió) tett szert. Több mint egy tucat startup értéke haladja meg az egymilliárd dollárt.

Sok cég még valóban a kezdeteknél, több mint a harmaduk a befektetések első körénél tart.

Hatvannégy vállalat székhelye található az Egyesült Államokban, nyolcé az Egyesült Királyságban, haté-haté Kínában és Izraelben. A távol-keleti nagyhatalom szerepét viszont jól jelzi, hogy a legnagyobb támogatásban részesült cégek listáján, az első háromból kettő kínai.

A tavalyi listáról mindössze huszonegyen maradtak állva, hármójuk túl van már a sikeres tőzsdei bevezetésen, egyikük a szokásos befektetői csatornák nélkül került tőzsdére, kettőt felvásároltak. Mindegyik működik még, nem fordítottak hátat a szakterületnek, nem hagyták abba.

Játék közben elnémíthatjuk a gyűlölködő beszólásokat

Az Intel Bleep (szó szerint: „sípjellel kicenzúráz”) hangfelismerő eszközével chatek automatikusan moderálhatók, lehetővé válik, hogy leállítsuk a ránk zúdított szidalmakat, durva beszédet. Játékokra találták ki, egyelőre a bétaváltozatnál tartanak, azt viszont sikeresen tesztelték, még idén várható a kereskedelmi forgalmazás.

A chipgyártó a tartalommoderáló technológiákat fejlesztő Spirit AI-val dolgozott együtt az új eszközön. A felhasználók finomhangolhatják, hogy egy-egy hangalapú kommunikációból mennyi és milyen típusú durva beszéd jusson el hozzájuk.

haters.jpg

A Bleep a beszéddetektálást kombinálja össze a Spirit AI csúcstermékével, amely chatkörnyezetben határozza meg, hogy egy kifejezés, mondat stb. zaklatásnak számít, vagy sem.

A rendszer kilenc kategória, például a szexuálisan explicit nyelvezet, az LGBTQ-ellenes gyűlöletbeszéd, vagy a nőgyűlölet alapján ítéli meg, mennyire sértő egy szöveg. A felhasználók dönthetnek, hogy egyet sem, többet vagy mindegyiket kiszűrik. A tizedikre, az (afroameriaikra vonatkozó sértő) N-szóra, a rendszer szintén felajánlja az igen/nem választási lehetőséget.

haters0.jpg

A Bleep egyelőre Windows-PC-ken fut, és mivel közvetlen interakcióban áll a Windows audiokontrollal, sok hangalapú chatalkalmazással működik.

Mások szintén próbálkoznak a játékokban lévő hangkommunikáció, chat önkéntes moderálásával.

A ToxMod moderátoroknak kínál a sértő nyelvezet szervereken átívelő követésére alkalmas kezelőfelületet. A Hive rendszere audió, videó, szöveges és képi tartalmak szűrésére egyaránt alkalmas, egyik ügyfele például a nem kívánt meztelen fotóktól óvja meg az azokra nem kíváncsi felhasználókat. A Two-Hat megoldása a moderálást például szándékos helyesírási hibákkal megtévesztő próbálkozásokat mutatja ki.

A fejlesztéseket a hálózati kommunikáció védelme, a visszaélések és sértegetések nélküli interakció vágya teszi szükségessé. A Rágalmazásellenes Liga felmérése alapján az amerikai online gamerek 22 százaléka azért hagyott abba játékokat, mert verbálisan inzultálták őket.

De még mielőtt cenzúrát kiáltanánk, ne felejtsük el, hogy a moderálásról mi magunk dönthetünk.

Hogyan építsünk pontosabb kvantumszámítógépet?

Az Amazon felhőszámításokkal foglalkozó Amazon Webszolgáltatások (AWS) leányvállalata új kvantumszámítógép-architektúráról közölt tanulmányt. Ha sikerül megvalósítaniuk, a hibakorrekció új szabványát jelentheti.

A gép egyelőre teljesen elméleti, viszont újfajta módszerrel irányítja a kvantumbiteket (qubiteket), így garantálva a lehető legpontosabb számításokat. Az anyagra valószínűleg sokan felkapják a fejüket, mert a kvantum hibakorrekció (QEC) a terület egyik leggyorsabban megoldandó problémája. Amíg nem sikerül, nehéz lesz hatékony kvantumszámítógépek fejlesztése. A mai rendszerek ugyanis hemzsegnek a hibáktól.

A qubitek sajnos nagyon instabilak, és a kvantumállapotuk külső környezetben azonnal összeomolhat, és így a számítások sem megbízhatók. Sok kutató dolgozik a hibadetektálás és a korrekció hatékony módszerein.

amazon_quantum.jpg

Kvantumalgoritmusokhoz többmillió vagy milliárd kvantumkapu kellhet, ezek a kapuk az alapjaik. Jelenlegi állapotukban viszont hajlamosak hibázni. A hibaráta ugyan csökken, de még mindig nagyságrendekkel több, mint amennyit egy megbízható algoritmus „elbír.” További csökkentésükhöz a fizikai szinten is új megközelítéseket kell alkalmazni.

A hagyományos módszer, az aktív QEC sok „nem tökéletes” vagy „fizikai” qubittel javítja ki a hibásnak azonosított qubitet, visszaállítva a részecske pontos állapotát. Az így létrehozott, irányítható qubit a logikai qubit.

Az aktív QEC azonban komoly hardverteljesítményt igényel. Mivel minden egyes logikai qubit kódolásához sok fizikai qubit szükséges, a masszív qubit áramkörökből álló univerzális kvantumszámítógép felépítése rendkívül nehéz feladat.

A passzív QEC megközelítés hibákkal szembeni stabilitással rendelkező fizikai számítási rendszer építésére összpontosít. E munkák zöme egyelőre csak a kísérleti szakasznál tart, a módszerrel viszont megteremthető a belső hibatűrés, amellyel felgyorsulna a nagymennyiségű qubitet tartalmazó kvantumszámítógépek fejlesztése.

Az AWS kutatói a két módszert kombinálva vázolták fel az elvileg pontosabb gépet. A rendszer passzív QEC formán alapul, a qubiteket oszcillátorban tartják a szuperpozíció állapotában, miközben a kvantumállapot fenntartására, fotonpárokat tesznek bele, vonnak ki belőle. Bizonyos hibatípusok ritkábbak, míg mások korrigálása passzív és aktív QEC technikák szigorúbb kombinációival érhető el.

Az eredmények bíztatóak, ám az elméleti architektúra fizikai eszközre alkalmazása előtt több kihívást meg kell még oldani. Az AWS mindenesetre úgy tűnik, felgyorsítja a fejlesztéseket, amely jelzés is egyben: az IBM, a Google, a Microsoft és mások mellett az Amazon is részt vesz a kvantum-versenyfutásban.

Mesterséges intelligencia fejti meg a kínai nyelv rejtelmeit?

A Pekingi Mesterséges Intelligencia Akadémia az általa együtt Wu Dao-nak nevezett négy különleges nyelvi modellt ismertetetett. A modelleket az ország vezető egyetemeinek és technológiai cégeinek a kutatói fejlesztették. A tudósok elmondták, hogy mind a négy sokat segíthet a kínai bürokráciában való eligazodásban, például a Pekingi Motorjárművek Hivatalával folytatott ügyintézésben.

A következőkről van szó:

A 2,6 milliárd paraméteres Wen Yuan kínai és angol nyelvi feladatokban vagy elérte, vagy túlszárnyalta a világ legismertebb modellje, a GPT-3 teljesítményét. A fejlesztők terve, hogy idén átméretezik, maximum 100 millió paraméterre csökkentik.

chinese0.jpg

A Wen Lan képekhez és videókhoz társít szöveget. A tanulóalgoritmussal a kutatók 50 millió kép-szöveg páron gyakoroltatták a modellt. Jelentős részük negatív példa, rossz adatcímke volt. Wen Lan a kép-szöveg vizsgálatban az eddigi legjobb modellnél is eredményesebben vizsgázott, 5 százalékponttal vert rá.

A szöveget generáló, 11,3 milliárd paraméterrel dolgozó Wen Hui általános nyelvi készségeket sajátít el. Szöveges útmutatások alapján verseket író, videókat és képeket létrehozó alkalmazásokat találtak ki hozzá.

chinese.jpg

A speciálisabb Wen Su emberi vérsejtekből vagy gyógyszerekkel szemben ellenálló baktériumokból következtet biomolekulák, például protein és DNS formájára.

A projekt újítása még az 1 trilliónál több paraméteres modellek gyakoroltatására kitalált FastMoE és egy kínai nyelvű adatbázis is.

A kínai kormány támogatásával 2018-ban alapított Pekingi Mesterséges Intelligencia Akadémia rendeltetése, hogy segítsen az ország globális MI-központtá válásában. Az intézmény más projektjeinek keretében ideghálók kognitív gyökereit vizsgálják, szabványosított MI jelmagyarázatokon dolgoznak, MI-specifikus chipeket fejlesztenek. A nyelvi modellek kidolgozása tökéletesen illeszkedik ezekhez a kezdeményezésekhez, az elképesztő (már-már felfoghatatlan) számsorok pedig önmagukban sokat elárulnak a modellek hatékonyságáról, és hogy mit is jelent a big data.

Videojátékos majom Elon Musk laboratóriumában

Elon Musk agy-számítógép interfészen (Brain-Computer Interface, BCI) dolgozó cége, a Neuralink múlt héten különös videót mutatott be: egy makákó majom az ősrégi videojáték Pongot játszotta. A számítógépet elméjével kontrollálta, irányította.

„Gondolati úton, agyába ültetett chip közvetítésével játszik” – nyilatkozta róla Musk.

neuralink0.jpg

A kilencéves majom agyának mindkét oldalára egy-egy eszközt kapcsoltak. A Link nevű szerkezet az idegsejtek tevékenységét rögzíti, miközben az állat interakciókat folytat a számítógéppel. Ezt a karok mozdulataiért részben felelős motorikus kortexbe implantált, nagyon pici elektródák teszik lehetővé.

A makákó megtanulta a joystick használatát, hogy hogyan mozgassa a kurzort a célpontra, amiért banánt kapott jutalmul.

neuralink.jpg

Az adatokat dekódoló algoritmusba táplálták, hogy valósidőben előre lehessen jelezni a majom kézmozdulatait. Mihelyst kalibrálták a dekódert, már nem a joystickkel, hanem gondolataival irányította a kurzort. (Előbbit egyébként ki is kapcsolták.)

A kísérlet ugyan látványos, de nem új. Az ötletet az 1960-as években felvetették, majmok pedig már a 2000-es évek elején tudtak agyukkal mozgatni kurzorokat. Az elképzelést 2006 óta tesztelik emberekkel. A tudományos közvélemény mindenesetre részletes, magyarázó tanulmányt is vár a videó mellé.

A legnagyobb újítás, hogy a bőrön nincsenek kábelek, az agy és a gép kommunikációja vezeték nélkül történik. Ezekkel a lépésekkel az emberen történő alkalmazások is biztonságossá válnak, és az állatkísérletek sem olyan kíméletlenek, mint voltak régebben.

A Neuralink augusztusban három disznóval tartott technológiai bemutatót. Egyikük, Gertrúd interakcióba lépett a számítógépes rendszerrel, agya jelzéseket küldött. A cég mindezekkel az emberi agy és a számítógépek közötti információáramlást akarja felgyorsítani. A technológia ugyan gyerekcipőben jár még, de bizakodnak, hogy mozgássérült személyek hamarosan az elméjükkel működtetnek majd komputereket.

Musk elmondta, hogy első termékükkel őket célozzák meg; okostelefonos alkalmazás lesz. Sokan viszont a személyes szférát (privacy) féltik, mert szerintük a technológiával akár a gondolataink is kiárusíthatók.

Robot felügyeli a hegesztő robotokat

Egyre kevesebb a képzett és ügyes munkafelügyelő. Nehéz rájuk találni, de ha sikerül is, alkalmazásuk nagyon drága, ráadásul nem mindig képesek átlátni egy robothegesztőkkel teli gyár összes szegletét. Következményként a hibák mindaddig észrevétlenek maradnak, amíg egy kisebb darab része nem lesz a nagyobb szerelvénynek.

Egyetlen hegesztett darab akár tízezer dollárba is kerülhet, tehát az észrevétlen hibák komoly anyagi következményekkel, veszteséggel járhatnak. Ha időben észlelik őket, idő és pénz spórolható meg. Manapság gépilátás-rendszerek segítenek ebben.

robothegeszto.jpg

Terjedőben a mesterséges intelligencia által működtetett minőségbiztosítás. Az olyan rendszerek, mint például a Landing AI egyre inkább és egyre nagyobb számban felismerik a gyártófolyamat közbeni hibákat.

E tendencia részeként, robotfelügyelők átnézhetnek a hegesztő robotok válla felett, és látják, hogyan dolgoznak a gépek.

robothegeszto0.jpg

A mezőgazdasági csúcsgépeket, például high-tech traktorokat gyártó amerikai John Deere gépilátás-rendszert fejlesztett hibák észlelésére. A rendszer abban segít, hogy nehéz masinái működésre kész állapotban kerüljenek le a gyártósorról.

Más gyártókhoz hasonlóan, a John Deere is hegesztő robotokat használ fémrészek összeillesztéséhez. Az elkészült gépek a farmoktól az erdőgazdálkodásig, vagy éppen az építőiparig, változatos területeken kerülnek alkalmazásra.

Csakhogy az ipari mértékű hegesztéssel régóta van egy komoly probléma. A készülőben lévő szerkezet belsejében, gázbuborékok keletkezhetnek. Hűlés közben a buborékok „legyengítik” az adott részeket. Az Intel például azért fejlesztett cselekvésfelismerő modellt, hogy valósidőben észrevegye a gyártás közbeni hibákat.

A John Deere modelljét jól és kevésbé jól sikerült hegesztésekről készült videókon gyakoroltatták. Mivel fényeket kizárólag a hegesztőpisztoly adott, a fényviszonyok nem befolyásolták a modell teljesítményét. A hegesztőpisztolyon lévő robusztus kamerára helyezve, 30-35 centiméterről látja a megolvasztott fémet.

Ha hegesztési hibát észlel, leállítja a hegesztő robotot, és azonnal értesíti a humán dolgozókat.

Cicának látja a békát a mesterséges intelligencia

Köztudott, hogy a gépi tanuláshoz használt adatsorokban találhatók hibák. A problémával foglalkozó korábbi vizsgálatok inkább a gyakorlásra, és nem az adatsorokra összpontosítottak. Megállapították, hogy a mélytanuló-rendszerek teljesítménye nem romlik, ha a címkéknek csak kis része pontatlan.

Két fontos tényt azonban figyelembe kell venni. Egyrészt, a hibákban bővelkedő tesztsorok nem igazi mércéi egy modell adottságainak, másrészt, a hibás címkék aránytalanul nagyobb mértékben befolyásolják a méretesebb modelleket.

errors0.jpg

Sajnos, több referenciaként kezelt adatsorban is akad bőven hibás címke. Számszerűsítve, a tíz leggyakrabban használt 3,4 százalékáról van szó – derül ki két MIT- (Massachusetts Institute of Technology) és egy Amazon-kutató közös tanulmányából. Kiemelik, hogy a rossz címkék negatív hatása a modellek méretének növekedésével párhuzamosan nő.

A legnépszerűbb adatsorok, köztük az ImageNet, az Amazon Reviews és az IMDB hibás címkéinek azonosítására gyakoroltattak be egy modellt. Egy rossz címke két kritériumnak tesz eleget: ha a modell előrejelzett osztályozása nem felel meg a címkének, és ha a modell osztályozásba vetett bizalma nagyobb volt, mint a címkézett osztály előrejelzésével kapcsolatos átlagos bizalma.

errors.jpg

A rosszul címkézett példákat humán „bírálók” is átnézték. Sok egyértelmű hibát találtak, például közönséges békára sütötte rá az MI, hogy macska, vagy egy énekes hanganyagára, hogy fütyörészés, negatív filmkritikákra, hogy pozitív, és így tovább. A QuickDraw idegháló dolgozott a legtöbb, (10,1 százalék), az MNIST a legkevesebb (0,15 százalék) pontatlanul felcímkézett anyaggal.

A kutatók kijavították a címkéket, majd korrigálták a tesztsorokat. Ezt követően mérték, hogy különböző modellek hogyan osztályozták a módosított adatsorokat. A kisebbek sokkal jobban teljesítettek, mint a nagyobbak.

Arra a következtetésre jutottak, hogy a mesterségesintelligencia-fejlesztéseknél ideje lenne a modellközpontú megközelítésről adatközpontúra váltani. Sok csúcsmodell elég jó már ahhoz, hogy az architektúrájával való bíbelődés kevés előnyt hoz, a teljesítmény növelésének legjobb módja viszont egyértelműen a tanulóadatok minőségének feljavítása.

süti beállítások módosítása