Arctalanítják a hatalmas kép-adatbázist

2021. április 14. - ferenck

Az ImageNet a világ egyik legnagyobb kép-adatbázisa, tökéletes terep tárgyazonosító, arcfelismerő és más vizuális mesterségesintelligencia-szoftverek, algoritmusok tesztelésére. A projekt vezetői eldöntötték, hogy a személyiségi jogok (privacy) védelmében, elmosódottá teszik az összes fényképen látható emberi arcokat.

A lépés azért is szükségszerű, mert a képek az illető személyek beleegyezése nélkül kerültek a gyűjteménybe. A gigantikus adatbázisok, adatsorok korában ugyanis egyszerűen lehetetlen minden alanytól begyűjteni a használathoz szükséges hozzájárulást.

Az utóbbi hetekben tesztelték, hogyan működnek a módosított képeken gyakorló modellek. Többféle felismerő feladatot kellett végrehajtaniuk.

Az Amazon Rekognition platformjával dolgozó kutatók közel 1,5 millió képen kerestek arcokat. A program elhatároló keretet tett az 500 ezernél több arc köré, ráadásul egyes képeken egynél több arc volt látható.

Közösségi közreműködéssel (crowdsourcing) toborzott önkéntesek ellenőrizték a modell munkáját, és ha kellett, korrigálták a hibákat. A kutatók ezt követően speciális technikával elhomályosították a kereten belüli arcokat.

Az eredeti ImageNet anyagokon és a módosított másolatokon huszonnégy képfelismerő rendszert gyakoroltattak. A különbség minimális volt, a megváltoztatott képeken dolgozó rendszerek átlagban alig egy százalékkal teljesítettek gyengébben. Az archoz jellemzően közeli tárgyak, például maszkok vagy harmonikák esetében viszont már jelentősen romlott a teljesítményük (-8,71, illetve -8,93 százalék).

Az elhomályosított vizuális adatok tanulásátadásra (transfer learning) gyakorolt hatását előre trenírozott modellekkel vizsgálták. Módosított és nem módosított képeket használtak, a modelleket tárgy-, jelenetfelismerésre, tárgydetektálásra és arcjegyek osztályozására finomhangolták. Az utóbbi arra vonatkozik, hogy az adott személy mosolyog, vagy sem, szemüveget visel, vagy sem, és így tovább. A módosított képeken dolgozó modellek nagyjából ugyanolyan eredményt értek el, mint az eredeti ImageNet anyagokon gyakorlók.

Jelenleg nagyon úgy tűnik, hogy az elhomályosított arcképes ImageNet lesz az új hivatalos változat.

A kutatás a személyiségi jogok nagyobb védelmét célzó széleskörű törekvés része. Tanulmányok szerzői évek óta javasolják rendszámtáblák és arcok elhomályosítását a Google Street View anyagain, önvezető járművek és cselekvéseket felismerő modellek gyakorlóadatain.

Mivel a gépi tanuláshoz használt adatsorok nem sérthetik meg a személyiségi jogokat, az azokat védő, ugyanakkor jó modellek gyakoroltatására alkalmas adatsorok kidolgozására van szükség. Pontosságuk valamelyest romolhat, de a minimális vesztség nincs arányban magánszféránk esetleges megsértésével. Egyébként az ImageNeten gyakorló legtöbb alkalmazás mindaddig a korábbiakhoz hasonló pontossággal fog működni, amíg nem az arcokhoz közeli tárgyakat kell azonosítaniuk. A problémán az adatok engedélyezett finomhangolása, azaz a képeken látható személyek hozzájárulása segíthet.