Az utóbbi hónapok, néhány év legfontosabb mélytanulás-eredményeit a szöveggel és képekkel foglalkozó modellek, köztük a legendává vált GPT-3 és az EfficientNet érték el. Eközben beindultak a szövegek és képek közötti kapcsolatokkal foglalkozó projektek, és míg a legtöbb multimodális (több módban is…
A nyelvtől a látásmodellekig, a mély ideghálók teljesítménye folyamatosan javul, például hatékonyabbak, jobbak az általánosításban. Ezekre a rendszerekre sajnos az elfogultság, csoportok pontatlan és sztereotip megjelenítése szintén jellemző. A magyarázatokkal adósak maradnak, plusz törékenyek is –…