Az Anthropic szokatlan és rendkívül nagyvonalú, egyben közösségi felelősségvállalásról tanúságot tevő lépéseket tett, hogy felkészítse a világot hamarosan megjelenő nagy nyelvmodelljére (LLM), a Claude Mythos Preview-ra. Állításuk szerint rendkívüli kockázatot jelent a cyberbiztonságra nézve.
Az LLM-ek egyre jobban kódolnak, és nemcsak képesek hibákat találni, hanem ki is tudják használni azokat. A Claude Mythos Preview elődeihez hasonlóan kockázatot, azokkal összevetve pedig lényegesen nagyobb kockázatot jelent a társadalmak működését biztosító kritikus szoftverekre. „Drámai mértékben jobban teszi ezt” – figyelmeztet a fejlesztőcég.

A modell teljesítménye felülmúlja a kéthónapos Claude Opus 4.6-ot, és meglepően jó kódok sebezhetőségeinek azonosításában és azok kiaknázásában. A vállalat 244 oldalas modellkártyán részletezi az LLM képességeit. A modellkártyák a modellekhez tartozó, hasznos információkat tartalmazó fájlok. Most publikáltak először ilyet anélkül, hogy maga a modell kereskedelmi forgalomba került volna. Az Anthropic egyelőre a megjelenés időpontját se jelentette be.
A meglévő kód ilyen képességekkel szembeni megerősítése érdekében a vállalat létrehozott egy Project Glasswing nevű konzorciumot. Az Amazon Web Services, az Apple, a CrowdStrike, a Google, a JPMorganChase, a Linux Foundation, a Microsoft és az Nvidia, valamint több mint negyven másik szervezet vesz részt benne.
Az Anthropic exkluzív hozzáférést biztosít a Glasswing tagjainak (százmillió dollár értékű kredit, egymillió bemeneti/kimeneti tokenenként 25/125 dollár), valamint négymillió dollár adományt nyílt forráskódú projektek fenntartásával foglalkozó szervezeteknek, hogy felfedezhessék és kijavíthassák az általuk ellenőrzött kód sebezhetőségeit, mielőtt a modell, vagy egy hasonló széles körben elérhetővé válna. Az Anthropic megígérte, hogy megosztja, mit csinál és mit tanul a Glasswing.
A fejlesztőcég nem gyakoroltatta a Claude Mythos Preview-t biztonsággal kapcsolatos feladatokon. A modell képességei kódolás, következtetés/érvelés és autonóm viselkedés betanításából származnak.
Teljesítménye lenyűgöző. Az Anthropic által végzett tesztekben jelentősen felülmúlta a Claude Opus 4.6-ot, az OpenAI GPT-5.4-et és a Google Gemini 3.1 Pro-t számos népszerű benchmarkban. A modellkártya részletezi a csapat erőfeszítéseit a modell betanítási adatainak benchmark tesztkészletekkel való szennyeződésének minimalizálása érdekében.
Hosszútávon a kódoló ágensek egyre hatékonyabbak lesznek. A sebezhetőségek egyszerű azonosítása biztonságosabb rendszerekhez vezet. Az átmenet viszont bizonytalan és bonyolult lesz. Jól képzett támadók például a védekezők által még nem ismert eszközöket is használhatnak.











