根据英国AI Security Institute的独立测试,Anthropic的Claude Mythos Preview成为首个完成复杂32步网络渗透挑战的AI模型。该模型在"The Last Ones"模拟中10次尝试成功3次,这个模拟模仿企业网络攻击,人类专业人士大约需要20小时才能执行。即使是失败的运行平均也完成了32步中的22步,显著超过Claude 4.6的16步平均水平。

这不是关于个人黑客技能——Mythos在孤立的网络安全任务上表现与GPT-5.4和Claude Opus 4.6等最新前沿模型相当,在基础capture-the-flag挑战中达到85%的成功率。突破在于跨多个网络段连锁攻击,这种能力将AI从复杂的脚本小子转变为类似真正渗透测试者的东西。这就是为什么Anthropic将Mythos限制给"关键行业合作伙伴"而不是公开发布。

但炒作需要校准。Mythos在"Cooling Tower"(一个七步电厂破坏模拟)中仍然失败,AISI的测试使用了受限的1亿token预算。该模型的网络能力虽然值得注意,但代表着渐进式进步,在这个格局中,AI安全技能自2023年GPT-3.5在基本任务上苦苦挣扎以来一直在稳步攀升。

对于构建AI驱动安全工具的开发者,这表明多步骤自主能力比预期更快到来。但这也意味着你对AI助手的安全假设需要更新——如果Mythos能连锁22个攻击步骤,更简单的模型可能能够处理对真正攻击者最重要的侦察和初始访问阶段。