A képosztályozás a számítógépes látást és a mintafelismerést (pattern recognition) egyesítő mesterségesintelligencia-diszciplína.
A szakterület eddigi legmodernebb rendszerét a tárgyfelismerő szoftverek kutatásához fejlesztett ImageNet adatbázisa mellett más adatbázisok 3,5 milliárd további képén gyakoroltatták. A döbbenetes információmennyiség feldolgozása azonban hatalmas számítási kapacitást – és energiafogyasztást – is igényel.
Hamarosan változhat a helyzet, mert egy sokkal kevesebb adatot, a képek tizedrészét használó új módszerrel pontosabb eredmény érhető el, ráadásul úgy, hogy a képeket fel sem címkézik.
A Google Brain egyik csoportja és az Eduard Hovey, a pittsburghi Carnegie Mellon Egyetem kutatója által bevezetett Zajos Diák (Noisy Student) eljárás lényege, hogy a modell másik modelltől, egyfajta tanár-diák viszonyban tanul. Az eredmény nem maradt el, jobban teljesített az ImageNeten.
Egyediségét az adja, hogy nem más gyakoroltatja, hanem saját maga csinál mindent, a tanármodell például címkézett adatokhoz generál álcímkéket, majd a tanulómodell következik, amely immáron mindkét (címkézett és álcímkés) adatfajtával képezi magát.
A Zajos Diák fejlesztői finomítottak az eredeti módszeren: diákhálózatuk nagyobb a tanárhálózatnál, és a gyakorlóadataiba zajt is tettek, hogy nehezebben dolgozza fel a képeket, stabilabb legyen a tudása. Tanár és diák természetesen ugyanazt az architektúrát használja, így a nagyobb kapacitás a diáknak különösen előnyös – több a paraméter, több adatot dolgoz fel, mint a tanár.
A tanár az ImageNet gyakorló adatsorán képezi magát, abból generál álcímkéket egy Google adatsor 300 millió felcímkézetlen képéhez, míg a diák gyakorlóadatsora az ImageNet tréningszettjéből és 130 ezer álcímkés Google képből áll.
Gyakorlás közben az algoritmus a diákot elbizonytalanító, „önálló gondolkodásra” sarkalló lépéseket tesz, így ér el tanáránál magasabb szintű általánosító képességeket. A tanár-diák tanulási ciklus ismételhető, és minden egyes korábbi diákból (értelemszerűen) tanár lesz.
Zajos Diák az ImageNet teljes anyagán és speciális sorokban egyaránt jobban teljesített elődjeinél.
Bíztató eredményeivel közelebb kerültünk a hibátlanul dolgozó képosztályozó technológiákhoz, az ezt a módszert használó tanulóalgoritmusok pedig bármelyik korábbi módszernél sokkal több adatot tudnak majd kezelni.