4 月 7 日,Anthropic 預告了 Claude Mythos,並在 red.anthropic.com 發布了帶具體數字的紅隊報告。兩週後,隨著影響逐步顯現,媒體的報導力度在加重。Mythos 不會通用發布,它進入一組受限的 Project Glasswing 合作夥伴——Amazon、Apple、Broadcom、Cisco、CrowdStrike、Linux 基金會、Microsoft 和 Palo Alto Networks 在內,總計 40 個組織——再加上精選的開源安全團體,包括 OpenSSF、Alpha-Omega、Apache 軟體基金會。Anthropic 承諾向工業合作夥伴投放 1 億美元的使用額度,向開源團體投放 400 萬美元。

基準測試是改變對話的那部分。在 Firefox JavaScript 漏洞開發上,Opus 4.6 在數百次嘗試中做出 2 個可用 exploit,成功率接近零。Mythos 做出 181 個可用 exploit,另有 29 次實現暫存器控制。在 OSS-Fuzz 語料庫(1000 個儲存庫,約 7000 個 fuzz 入口點)上,Opus 4.6 和 Sonnet 4.6 各自落地 150 到 175 個一級當機,約 100 個二級,一個三級。Mythos 落地 595 個一級至二級當機,少量三四級,以及 10 個代表完整控制流劫持的五級發現。Anthropic 的漏洞清單包括 OpenBSD 中 27 年的 SACK TCP 漏洞,可遠端 DoS;FFmpeg 中 16 年的 H.264 編解碼漏洞(程式碼庫超過 20 年);FreeBSD NFS 中 17 年的未認證 RCE(CVE-2026-4747);Linux 核心組合 2 到 4 個漏洞的提權鏈;所有主流瀏覽器中帶 sandbox 逃逸的 JIT heap-spray 利用;以及 TLS、AES-GCM、SSH 實作的弱點。Anthropic 說 99% 以上的發現尚未修復;可公開討論的不到 1%。

經濟帳是值得坐下來消化的部分。找到那個具體的 27 年 OpenBSD 漏洞花了不到 50 美元的算力。對 OpenBSD 跑一千次探索活動總共花了不到 2 萬美元。FFmpeg 的發現加起來約 1 萬美元。N-day 漏洞開發每個可用 exploit 約 1000 至 2000 美元。有史以來第一次,在基礎軟體中找到關鍵漏洞的成本曲線落到修補與部署修復的成本曲線之下。驗證資料支持這一點:198 份人工複核的 Mythos 報告中,89% 與 Claude 自身的嚴重性評估完全一致,98% 在一個嚴重性級別之內。這不是幻覺性漏洞劇場。Anthropic 的回應是不通用發布:Mythos Preview 留在 Project Glasswing 之內,通用可用性被明確排除。

如果你發布或依賴具有真實攻擊面的軟體,有三件事可做。一,99% 未修復這個數字是一種含蓄承認:現有協調披露的吞吐無法吸收這種能力所發現的——如果你維護有 CVE 歷史的套件,請在等同能力出現在 preview 存取之外之前把回應流水線整理好。二,Mythos 在舊程式碼(27、17、16 年)上的成功表明 AI 輔助稽核的真正用武之地不在於時髦的新協定,而在於那些無聊、成熟、十年無人審視的老傢伙。三,「不發布即安全」是先例,不是解決方案。Anthropic 選擇不通用發布這個模型,但能力曲線就是能力曲線。從現在到等同模型商品化可得之間的差距,是寬限期,不是保證。