Sam Altman 在 Core Memory 播客上发话,批评 Anthropic 对 Claude Mythos Preview 的定位——本月早些时候通过 Project Glasswing 释出的那款受限网安模型。Altman 把这种框架称为「恐惧营销」,原句是:「这明显是高明的营销——我们造了颗炸弹,正要扔你头上。我们还能卖你一座 1 亿美元的防空洞。」Anthropic 宣布过向合作伙伴组织投放至多 1 亿美元的 Project Glasswing 使用额度;Altman 的数字显然直接指向这一承诺。
实质分歧在于:Anthropic 对 Mythos 的限制是基于能力的谨慎,还是一种商业定位。Anthropic 公开的红队报告给出具体数字——Mythos 在 Opus 4.6 只做出 2 个可用 Firefox JavaScript exploit 的尝试场景里做出 181 个;在 OSS-Fuzz 语料上拿下 10 个五级(完整控制流劫持)发现,而前作零;并在 OpenBSD、FFmpeg、FreeBSD NFS 与所有主流浏览器中发现了数十年老漏洞。Mozilla 自家与 Anthropic 的 Firefox 安全协作(使用 Mythos 下一层的公开型号 Opus 4.6)两周内产出 22 个 CVE 与 14 个高危修复,约占 Mozilla 2025 年高危总数的 20%。Altman 在批评中并未与这些具体跑分对话。
这场交锋凸显前沿 AI 商业定位的一个真实张力。OpenAI 历来强调更广的可得性;Anthropic 强调与能力门槛挂钩的规模化安全框架。Mythos/Glasswing 是后者到今天为止最激进的版本:不做通用发布,分发给经核验的合作伙伴并配以财务激励,用受限层向公众展示防守价值。Altman 的批评之所以能落脚在那里,是因为 1 亿美元这个承诺是一笔可见的美元金额,可以被重新框定为「收入模式」而非「安全成本」。这种重新框定并不显然正确,但也并不显然错误;它取决于你是否相信 Mythos 与公开前沿之间的能力不对称真实到足以证成这一访问框架。
对 builder 有两点要记。其一,如果你做的产品依赖某个特定实验室的合作(API 访问、Bedrock 或 Vertex 合作、预览级模型),该实验室的公开安全姿态就是你风险模型里的一个输入,不只是行业背景。Altman/Amodei 这种对能力框架的公开分歧,会在较短时间尺度上变成访问政策的变动。其二,到底谁的框架对,未来十二个月会以实证给出答案。如果 Mythos 级能力在 Project Glasswing 之外的野外出现,并产出 Anthropic 报告所描述规模的利用,「恐惧营销」这读法就更难站得住;如果没有这种利用出现,「造了颗炸弹」这种框架就开始显得过度。不管哪一边,最终结清这场争论的是跑分数据与实际攻击数据,而不是修辞。
