Anthropic 本周发布了 Project Glasswing 更新,报告 Claude Mythos——其在 2026 年 4 月推出的自主漏洞发现 LLM——在约两个月内已在 1,000+ 个开源项目中识别出 10,000+ 个缺陷。完整数字:23,019 个总 issue,6,202 个评为高危或严重严重性,1,752 个迄今已验证,已确认的真阳性率超过 90%。联合扫描合作伙伴包括 Cloudflare、Mozilla 等。披露遵循与维护者协调的 90 天禁令——例如 wolfSSL 的发现已修复,但细节保密。对于在 OSS 依赖之上 ship 任何东西的 builder 来说,要点很具体:供应链的相当一部分刚刚被大规模审计,接下来 90 天将揭示补丁轨迹。

发布中的架构框架是故意单薄的。Anthropic 没有披露 Mythos 是独立模型、agent harness,还是 Glasswing 特定的组合——只知道它自主扫描、验证并生成漏洞利用。在 1,752 个已验证 issue 上 90%+ 的真阳性率是值得关注的标题数字;这就是工具停止生成无意义工作并开始生成实际补救队列的速率上限。与本周早些时候微软发布的内容比较——MDASH,100+ 个专门 agent 管线(扫描/辩论/验证/去重/利用)在 CyberGym 1,507 个真实漏洞上得分 88.45%——你就有两个最大的美国 AI 实验室在七天内相继发布自主漏洞研究版本。agent 驱动的漏洞研究类别是真实的,现在在公开场合竞争,两者都在内部以非常大的规模测试(微软在 Windows/Hyper-V/Azure 上,Anthropic 在 1,000+ 个 OSS 项目上)。

访问和安全框架是 builder 需要仔细阅读的部分。Mythos 今天的访问通过 Project Glasswing 合作伙伴受限(AWS、Apple、Google、Microsoft 等),加上面向企业客户的 "Claude Security" 公测。Anthropic 明确表示"没有公司开发出足够强的安全防护来防止此类模型被滥用",并保留"Mythos 级模型"等待更强的安全防护。这是不寻常的直接承认。诚实的解读是:同一个发现 10K 漏洞的模型也可以用同样的速度编写漏洞利用——合作伙伴限制是直到对齐改进之前的摩擦层。对于独立安全研究人员和小型 builder,这意味着等待;对于已在 Glasswing 或 Claude Security 上的企业安全团队,该能力现在就在这里。

周一上午:如果你维护任何规模的开源项目,预计未来 90 天内会有来自 Mythos 发现的协调披露邮件流量——Cloudflare 和 Mozilla 已经在循环中。如果你 ship 一个在 OSS 依赖下游的产品,把这个假设构建到补丁节奏中:供应链的大规模审计正在发生,补丁的长尾将在 Q2 余下时间持续到达。如果你在为自己的管线评估自主漏洞研究工具,Mythos(受限)和 MDASH(私有预览)是本周发布的两个参考点——架构模式(自主扫描-验证-利用管线)即使没有访问任何平台,也可以从公开细节复现。未解决的诚实问题:23,019 个 issue 如何按类别分解(内存安全、注入、身份验证绕过、逻辑错误),因为公开发布只披露了严重性等级。类级数据将让 builder 优先考虑自己的扫描。