Teljesen elavulnak a captchák

2018. december 13. - ferenck

Az angliai Lancaster, az amerikai Északnyugati és a Pekingi Egyetem kutatói az egyik legszélesebb körben használt honlap-biztonsági rendszer végét jelentő mesterséges intelligenciát fejlesztettek.

A mélytanuláson (deep learning) alapuló algoritmus jelenleg a leghatékonyabb captcha megoldó-séma, megfejti a világ legtöbb népszerű oldala által használt szöveges captchákat.

A captcha az emberi felhasználót a számítógéptől megkülönböztető automatikus teszt. A komputer feladványt generál, amit csak ember képes helyesen megválaszolni, viszont a gép is könnyedén eldönti a válasz helyességét. Általában eltorzított, gyakran számokkal kombinált szöveget kell elolvasni, és jól működik spambotok kiszűrésében. (Maga a szó a Completely Automated Public Turing test to tell Computers and Humans Apart, magyarul „teljesen automatizált nyilvános Turing-teszt a számítógép és az ember megkülönböztetésére” rövidítése.)

Az új megoldó sokkal jobb eredményeket ért el, mint a korábbi támadó rendszerek, és az olyan captchákat is megoldja, amelyekkel elődei csődöt mondtak. Nagyon gyorsan dolgozik, desktop PC-ről átlagosan 0,05 másodperc alatt megfejt egy captchát.

Az algoritmus generatív ellenséges hálózatokat (generative adversarial network, GAN) használ. A captcha-generátor az eredetiektől megkülönböztethetetlen, nagymennyiségű gyakorló captchát állított elő, az algoritmus rajtuk gyakorolt, majd finomítottak rajta, és valódiakkal tesztelték.

Gépi tanulással támogatott captcha-generátorral a támadók jelentősen csökkentik az egyébként manuálisan felcímkézett captchákkal eltöltendő tanulóidőt, és milliók helyett mindössze 500 elég a hatékonysághoz.

A korábbi megoldók általában egy captcha-változatra specializálódtak. A gépitanulás-alapú támadásokhoz sok munka, kézi címkézés stb. kellett, ráadásul már az apró védelmi változtatásokkal sem boldogultak. Mivel az új algoritmushoz nincs szükség sok emberi beavatkozásra, könnyen átdolgozható, és máris új, módosított captcha-sémák támadhatók vele.

33 sémán tesztelték, amelyből 11-et a világ legnépszerűbb oldalai, köztük az eBay, a Wikipédia és a Microsoft is használ.

„Ez volt az első alkalom, amikor GAN-alapú megközelítéssel építettek captcha-megoldókat. Munkánk bebizonyította, hogy a mostani rendszerek szövegalapú sémái mélytanulásos támadásokkal szemben különösen sebezhetők” – nyilatkozta Zheng Wang, az egyik kutató (Lancaster Egyetem).

Azaz, sok honlap elsődleges „védelmi vonala” minimális védelmet nyújt, de lassan már annyit sem. Hackerek könnyedén indíthatnak szolgáltatásmegtagadásos (DoS) támadást, küldhetnek spam-et vagy adathalász e-maileket stb. A kutatók tanácsa: jobb, ha a honlapok felhagynak a captchákkal, és például felhasználói szokásokon, az eszköz térbeli pozícióján vagy biometrikus adatokon alapuló, többszintes alternatív megoldásokat keresnek.