根據英國AI Security Institute的獨立測試,Anthropic的Claude Mythos Preview成為首個完成複雜32步網路滲透挑戰的AI模型。該模型在「The Last Ones」模擬中10次嘗試成功3次,這個模擬仿效企業網路攻擊,人類專業人士大約需要20小時才能執行。即使是失敗的運行平均也完成了32步中的22步,顯著超過Claude 4.6的16步平均水準。

這不是關於個人駭客技能——Mythos在孤立的網路安全任務上表現與GPT-5.4和Claude Opus 4.6等最新前沿模型相當,在基礎capture-the-flag挑戰中達到85%的成功率。突破在於跨多個網路段鏈結攻擊,這種能力將AI從複雜的腳本小子轉變為類似真正滲透測試者的東西。這就是為什麼Anthropic將Mythos限制給「關鍵行業合作夥伴」而不是公開發布。

但炒作需要校準。Mythos在「Cooling Tower」(一個七步電廠破壞模擬)中仍然失敗,AISI的測試使用了受限的1億token預算。該模型的網路能力雖然值得注意,但代表著漸進式進步,在這個格局中,AI安全技能自2023年GPT-3.5在基本任務上苦苦掙扎以來一直在穩步攀升。

對於構建AI驅動安全工具的開發者,這表明多步驟自主能力比預期更快到來。但這也意味著你對AI助手的安全假設需要更新——如果Mythos能鏈結22個攻擊步驟,更簡單的模型可能能夠處理對真正攻擊者最重要的偵察和初始存取階段。