Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Hogyan szúrjunk ki arcokat a tömegből?

2019. január 04. - ferenck

A közismert mondás szerint egy kép ezer szóval ér fel. De mi van akkor, ha meg sem tudjuk mondani, hogy mit látunk rajta? Homályos családi fotóktól iskolai fényképekig, sokszor nehéz megállapítani, hogy pont mire is gondolhatnak a megörökített személyek.

Gépi tanulás, ideghálókon alapuló mélytanulás (deep learning) segítségével a Delaware Egyetem (UD) egyik kutatócsoportja úgy tűnik, képes megválaszolni a bonyolult kérdéseket. Tömegből arcokat kiszúrni is nehéz, érzelmi állapotuk azonosítása pedig még nagyobb kihívás. (A győzteseket a 2018 októberében tartott ACM Nemzetközi Konferencia a Multimodális Interakcióról rendezvényen hirdették ki.)

crowd.jpg

A Xin (Cindy) Guo doktorandusz által vezetett DE-csapat első helyet ért el a Hatodik Érzelem-felismerés a vadonban (EmotiW 2018) három kategóriájának egyikében, a csoportszintű érzelem-felismerésben.

A csapatoknak embercsoportot ábrázoló képsort adtak, és a fotókon látható személyeket érzelmi állapotuk alapján boldognak, közömbösnek vagy negatívnak osztályozó algoritmust kellett fejleszteniük.

crowd0.jpg

Másfél hónapjuk és hét próbálkozásuk volt a lehető legpontosabb algoritmus kidolgozására.

Az UD győztes megoldása kacifántos címet kapott: arcokon, jeleneteken, testvázon és képi figyelmen alapuló vegyes mély modellt használó csoportszintű érzelem-felismerés.

A kutatók hét különböző modellt összekapcsolva dolgozták ki az eltérő felbontású, homályostól a kristálytiszta fényképekig, szinte mindenen dolgozó algoritmust.

A kutatás célja honlapokra feltöltött képek automatikus osztályozása.

„Ha keresünk, azért fogjuk látni a keresett képeket, mert az algoritmus lefut és felcímkézi, hogy az adott személyek boldogok, vagy sem. Tüntetésen, partin, esküvőn vagy például találkozón megörökített embercsoportok érzelmeinek elemzésére használható. A technológia továbbfejleszthető arra is, hogy az algoritmus megmondja: milyen típusú eseményt ábrázol egy adott kép” – magyarázza Guo.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr414524324

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Mr. Neutron 2019.01.05. 18:06:16

Honlapképek osztályozása - a fenét. Ezeket az alkalmazásokat elsősorban a közterületi térfigyelő rendszerekben fogják alkalmazni. A szlogen a terrorcselekmények és a zavargások megelőzése és az azonnali reagálás megtámogatása mesterséges intelligenciával. A nagyvárosi rendfenntartásról és embertömegek automatizált ellenőrzéséről van szó. Egy csomó hasonló projekt fut az EU-ban is, csak nem verik nagydobra.