Anthropic的Claude Mythos Preview能夠自主發現零日漏洞並在主流作業系統和瀏覽器上建構可用的攻擊利用,標誌著相比之前AI模型的能力飛躍。在針對Firefox 147個JavaScript引擎漏洞的內部測試中,Mythos Preview成功181次,而其前代產品Opus 4.6僅成功建構了2個可用攻擊利用。該模型在OSS-Fuzz語料庫的10個獨立目標上實現了完整的控制流劫持,相比之下Opus 4.6在7000個入口點中只成功了1次。
這不是漸進式進步——這是一個相變,崩潰了漏洞發現和利用之間的傳統差距。我之前寫過Anthropic的智慧代理工作,這證實了他們正在建構以我們從未見過的水準自主運行的系統。研究人員並沒有明確訓練這些能力;它們從推理和程式碼理解的整體改進中湧現出來。這既令人矚目又令人擔憂——我們沒有設計的能力正在作為讓模型更智慧的副作用出現。
資安影響是直接且嚴重的。當專業資安承包商審查該模型的198項發現時,他們89%的時間都同意嚴重性評估。該模型在OpenBSD的TCP SACK實作中發現了一個27年的拒絕服務漏洞,證明它能夠發現人類稽核員幾十年來都錯過的漏洞。Anthropic正在限制對「關鍵產業合作夥伴和開源開發者」的存取,但這種能力不可避免地會傳播到其他模型。
對於任何使用AI建構的人:這永久性地改變了資安格局。讓這些模型更好地幫助你編寫程式碼的同樣推理改進,也讓它們在破壞程式碼方面變得指數級更好。我們正在進入一個自動化攻擊利用生成以機器速度和規模運行的時代。
