Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Madarakat les a gépszem

2019. november 12. - ferenck

Időnként több évig kell madarakat figyelnünk ahhoz, hogy az egyik fajt megkülönböztessük a másiktól. A Duke Egyetem kutatói lerövidítették a folyamatot, mélytanulás-alapú mesterséges intelligenciájuk sokkal rövidebb idő alatt akár 200 fajt azonosít. Úgy megtanították, hogy egy fajhoz egy kép elég neki.

Különlegessége, hogy nemcsak a végeredményt látjuk, hanem azt is, hogyan „gondolkozik”. Így jobban megértjük, és még az állatokat nem ismerők is képesek lesznek megkülönböztetni például a pingvint a Déli óceán más madaraitól.

aibirdwatch.jpg

A mély idegháló komoly tanulási folyamat eredményeként jutott el eddig. 200 madárfajt ábrázoló 11788 fényképpel gyakoroltatták, és ma már a legkülönfélébb környezetekben tevékenykedőket, például a vízben úszó kacsát és a légben szárnyaló kolibrit is felismeri.

Soha nem mondják neki, hogy „ez egy csőr” vagy „ez egy szárny, tollakkal”, helyette fotókat mutatnak. Az idegháló észreveszi rajtuk a fontos mintázatokat, majd a mintákat a korábban látott fajok tipikus jegyeivel összehasonlítva, találgatni kezd.

Menet közben hőtérképeket készít, amelyekből ilyen következtetéseket von le: „ez egy énekesmadár, kapucnis poszáta. A következő jegyek alapján ismerhető fel: álarcos fej, sárga has stb.”

aibirdwatch0.jpg

Az MI jelenleg 84 százalékos pontossággal dolgozik, nagyjából ugyanúgy, mint a legjobban teljesítő emberek. Magukból a statisztikákból persze nem derül ki, hogyan különbözteti meg az egyik verebet a másiktól.

A kutatás egyik vezetője, a felsőoktatási intézmény Előrejelzés-elemző laboratóriumát vezető Cynthia Rudin szerint a projekt túlmutat a madarak megnevezésén; sokkal inkább arról szól, hogy a háló mit lát, hogyan vizualizálja azt.

Hasonló technológiát használnak személyek felcímkézésére közösségi hálózatokon, gyanúsítottak kamerák általi megfigyelésénél, önvezető autók betanításához, hogy érzékeljék a lámpákat és a gyalogosokat.

A legnagyobb probléma, hogy mivel a mélytanuló algoritmusok a hagyományos szoftverekkel ellentétben explicit programozás nélkül tanulnak az adatokból, nem mindig egyértelmű, hogyan jutnak el a végeredményhez, hogyan csoportosítanak képeket.

Rudin és munkatárai igyekeznek bizonyítani: az MI-nek nem feltétlenül így kell működnie. Modelljeiket úgy tervezték, hogy magyarázzák el az állításaikat megalapozó érveket, döntéseik legyenek érthetők. Ha egy ilyen modell hibázik, tudjuk, miért téved.

Az algoritmust hamarosan más területen, orvosi képalkotásnál, mellrákra utaló jelek kiszűréséhez használják. Orvosokat fog utánozni.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr3615297838

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.