Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Saját nyelvet talált ki egy képgeneráló MI

2022. június 10. - ferenck

Az elmúlt évtized gyors gépitanulás-fejlődése ellenére, kutatók még mindig gyakran nem értik, hogy automatizált rendszerek hogyan hoznak döntéseket. Komplex természetesnyelv-technológiák, mint az OpenAI GPT-3-ja néha annyira homályosan működnek, hogy szakértőknek komoly problémát okoznak a döbbenetes eredmények. Nem tudják pontosan, hogy az MI hogyan jut el odáig.

Úgy tűnik, hogy a GPT-3 legfejlettebb változata, a DALL-E2 saját nyelvet hozott létre – állítja Giannis Daras, az austini Texas Egyetem számítástudományi PhD-hallgatója.

dalle.jpg

A rendszerre sokan felfigyeltek idén, amikor szöveges utasításokat, leírásokat fotorealisztikus, egyes esetekben egyenesen művészi képekké alakított át. Most pedig saját titkos kódjának létrehozásával még titokzatosabbnak, hatékonyabbnak tűnik.

Daras egy virális Twitter bejegyzésben arról írt, hogy az algoritmust utasította: alakítsa képpé a „farmerek zöldségekről beszélgetnek” szöveget, és tegye mindezt az ismeretlen „viootes” szóval. DALL-E2 zöldségeket ábrázoló képpel rukkolt elő. Aztán a teljes nonszensz „poploe vesrreitars” következett, amire több madár-kép volt a válasz.

„Úgy tűnik, hogy a farmerek madarakról beszélneket a zöldségeikkel keverte össze” – írja Daras, és levonta a következtetést: az MI „rejtett szótárt” generált, ami párhuzamosan működik az elsődleges funkciójával.

dale0_1.jpg

Ez egy újabb példa arra, hogy miért nem értjük teljesen fejlett MI-k tevékenységét. A titkos nyelv mindenesetre több biztonsági és interpretációs kihívást jelent.

Az eredmények persze nem 100 százalékosan konzisztensek. A „Contarra ccetnxniams luryca tanniounons” halandzsára a rendszer időnként bogár-, máskor többé-kevésbé állatképeket hoz létre.

Nem ért mindenki egyet Daras-szal.

A kutatást elemző Benjamin Hilton szerint véletlen szerencséről van szó, de például az „poploe vesrreaitais” madár- vagy bogárnévként is hangozhat.

„Inkább sztochasztikus, random zaj, semmint DALL-E2 titkos nyelve” – magyarázza.

Az is elképzelhető, hogy a rendszer parancsikonokat hoz létre a képek kóddá alakításával.

Ha viszont Daras állításai bizonyosságot nyernek, új fejlődési irányok bontakozhatnak ki.

 

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr9517850493
süti beállítások módosítása