Sam Altman 在 Core Memory 播客上發話,批評 Anthropic 對 Claude Mythos Preview 的定位——本月早些時候透過 Project Glasswing 釋出的那款受限網安模型。Altman 把這種框架稱為「恐懼行銷」,原句是:「這明顯是高明的行銷——我們造了顆炸彈,正要扔你頭上。我們還能賣你一座 1 億美元的防空洞。」Anthropic 宣布過向合作夥伴組織投放至多 1 億美元的 Project Glasswing 使用額度;Altman 的數字顯然直接指向這一承諾。
實質分歧在於:Anthropic 對 Mythos 的限制是基於能力的謹慎,還是一種商業定位。Anthropic 公開的紅隊報告給出具體數字——Mythos 在 Opus 4.6 只做出 2 個可用 Firefox JavaScript exploit 的嘗試場景裡做出 181 個;在 OSS-Fuzz 語料上拿下 10 個五級(完整控制流劫持)發現,而前作零;並在 OpenBSD、FFmpeg、FreeBSD NFS 與所有主流瀏覽器中發現了數十年老漏洞。Mozilla 自家與 Anthropic 的 Firefox 安全協作(使用 Mythos 下一層的公開型號 Opus 4.6)兩週內產出 22 個 CVE 與 14 個高危修復,約占 Mozilla 2025 年高危總數的 20%。Altman 在批評中並未與這些具體跑分對話。
這場交鋒凸顯前沿 AI 商業定位的一個真實張力。OpenAI 歷來強調更廣的可得性;Anthropic 強調與能力門檻掛鉤的規模化安全框架。Mythos/Glasswing 是後者到今天為止最激進的版本:不做通用發布,分發給經核驗的合作夥伴並配以財務激勵,用受限層向公眾展示防守價值。Altman 的批評之所以能落腳在那裡,是因為 1 億美元這個承諾是一筆可見的美元金額,可以被重新框定為「收入模式」而非「安全成本」。這種重新框定並不顯然正確,但也並不顯然錯誤;它取決於你是否相信 Mythos 與公開前沿之間的能力不對稱真實到足以證成這一存取框架。
對 builder 有兩點要記。其一,如果你做的產品依賴某個特定實驗室的合作(API 存取、Bedrock 或 Vertex 合作、預覽級模型),該實驗室的公開安全姿態就是你風險模型裡的一個輸入,不只是行業背景。Altman/Amodei 這種對能力框架的公開分歧,會在較短時間尺度上變成存取政策的變動。其二,到底誰的框架對,未來十二個月會以實證給出答案。如果 Mythos 級能力在 Project Glasswing 之外的野外出現,並產出 Anthropic 報告所描述規模的利用,「恐懼行銷」這讀法就更難站得住;如果沒有這種利用出現,「造了顆炸彈」這種框架就開始顯得過度。不管哪一邊,最終結清這場爭論的是跑分資料與實際攻擊資料,而不是修辭。
