UK के AI Security Institute की independent testing के अनुसार, Anthropic का Claude Mythos Preview एक complex 32-step network infiltration challenge complete करने वाला पहला AI model बना। Model ने "The Last Ones" simulation में 10 में से 3 attempts में सफलता पाई, जो corporate network attacks की नकल करता है जिसे execute करने में human professionals को लगभग 20 घंटे लगते हैं। Failed runs भी average में 32 required steps में से 22 complete करते थे, जो Claude 4.6 के 16-step average को काफी पीछे छोड़ता है।
यह individual hacking skills के बारे में नहीं है—Mythos isolated cybersecurity tasks पर GPT-5.4 और Claude Opus 4.6 जैसे recent frontier models के comparable perform करता है, basic capture-the-flag challenges में 85% success rates hit करता है। Breakthrough multiple network segments के across attacks को chain करने में है, एक capability जो AI को sophisticated script kiddie से actual penetration tester जैसे किसी चीज़ में transform करती है। इसीलिए Anthropic ने Mythos को publicly release करने के बजाय "critical industry partners" तक restrict किया।
लेकिन hype को calibrate करना जरूरी है। Mythos अभी भी "Cooling Tower," एक seven-step power plant disruption simulation में fail करता है, और AISI के tests ने constrained 100 million token budget का उपयोग किया। Model की cyber capabilities, notable होने के बावजूद, एक landscape में incremental progress represent करती हैं जहाँ AI security skills 2023 में GPT-3.5 के basic tasks के साथ struggle करने से steadily climb कर रहे हैं।
AI-powered security tools build करने वाले developers के लिए, यह signal करता है कि multi-step autonomous capabilities expected से faster arrive हो रही हैं। लेकिन इसका मतलब यह भी है कि AI assistants के बारे में आपकी security assumptions को updating की जरूरत है—अगर Mythos 22 attack steps chain कर सकता है, तो simpler models शायद reconnaissance और initial access phases handle कर सकते हैं जो real attackers के लिए सबसे ज्यादा matter करते हैं।
