Anthropic 本週發布了 Project Glasswing 更新,報告 Claude Mythos——其在 2026 年 4 月推出的自主漏洞發現 LLM——在約兩個月內已在 1,000+ 個開源專案中識別出 10,000+ 個缺陷。完整數字:23,019 個總 issue,6,202 個評為高危或嚴重嚴重性,1,752 個迄今已驗證,已確認的真陽性率超過 90%。聯合掃描合作夥伴包括 Cloudflare、Mozilla 等。揭露遵循與維護者協調的 90 天禁令——例如 wolfSSL 的發現已修復,但細節保密。對於在 OSS 相依之上 ship 任何東西的 builder 來說,要點很具體:供應鏈的相當一部分剛剛被大規模稽核,接下來 90 天將揭示補丁軌跡。
發布中的架構框架是故意單薄的。Anthropic 沒有揭露 Mythos 是獨立模型、agent harness,還是 Glasswing 特定的組合——只知道它自主掃描、驗證並生成漏洞利用。在 1,752 個已驗證 issue 上 90%+ 的真陽性率是值得關注的標題數字;這就是工具停止生成無意義工作並開始生成實際補救佇列的速率上限。與本週早些時候微軟發布的內容比較——MDASH,100+ 個專門 agent 管線(掃描/辯論/驗證/去重/利用)在 CyberGym 1,507 個真實漏洞上得分 88.45%——你就有兩個最大的美國 AI 實驗室在七天內相繼發布自主漏洞研究版本。agent 驅動的漏洞研究類別是真實的,現在在公開場合競爭,兩者都在內部以非常大的規模測試(微軟在 Windows/Hyper-V/Azure 上,Anthropic 在 1,000+ 個 OSS 專案上)。
存取和安全框架是 builder 需要仔細閱讀的部分。Mythos 今天的存取透過 Project Glasswing 合作夥伴受限(AWS、Apple、Google、Microsoft 等),加上面向企業客戶的「Claude Security」公測。Anthropic 明確表示「沒有公司開發出足夠強的安全防護來防止此類模型被濫用」,並保留「Mythos 級模型」等待更強的安全防護。這是不尋常的直接承認。誠實的解讀是:同一個發現 10K 漏洞的模型也可以用同樣的速度編寫漏洞利用——合作夥伴限制是直到對齊改進之前的摩擦層。對於獨立安全研究人員和小型 builder,這意味著等待;對於已在 Glasswing 或 Claude Security 上的企業安全團隊,該能力現在就在這裡。
週一早上:如果你維護任何規模的開源專案,預計未來 90 天內會有來自 Mythos 發現的協調揭露郵件流量——Cloudflare 和 Mozilla 已經在迴圈中。如果你 ship 一個在 OSS 相依下游的產品,把這個假設建構到補丁節奏中:供應鏈的大規模稽核正在發生,補丁的長尾將在 Q2 餘下時間持續到達。如果你在為自己的管線評估自主漏洞研究工具,Mythos(受限)和 MDASH(私有預覽)是本週發布的兩個參考點——架構模式(自主掃描-驗證-利用管線)即使沒有存取任何平台,也可以從公開細節重現。未解決的誠實問題:23,019 個 issue 如何按類別分解(記憶體安全、注入、身分驗證繞過、邏輯錯誤),因為公開發布只揭露了嚴重性等級。類級資料將讓 builder 優先考慮自己的掃描。
