在美國政府實施出口管制、暫停存取 Anthropic 的 Fable 與 Mythos 模型三天之後,七十六位網路安全專家簽署了一封公開信,稱此舉危險。這些簽名所具有的分量難以被當作業界自利而輕易揮去,因為這些名字是該領域最具公信力的一些人物:Facebook 前資安長 Alex Stamos、Bugcrowd 創辦人 Casey Ellis、密碼學家 Jon Callas、Paul Vixie、Block 前資安主管 Dino Dai Zovi、Luta Security 創辦人 Katie Moussouris,以及 SocialProof Security 執行長 Rachel Tobac,還有數十位其他人士。

他們的論點關乎不對稱。防禦者運用前沿模型來尋找漏洞、理解漏洞並撰寫修補程式,而這封信表示禁令已把最好的模型從從事這項工作的人手中奪走。如連署者所言,在沒有充分理由的情況下、於我們的對手正迅速進步之際把最佳能力從防禦者手中抽離,是危險的。Moussouris 把實務版本說得很具體:防禦意味著能夠請 AI 修補一個檔案中的錯誤、解釋為何這項修補很重要,並撰寫測試以確認該修補程式有效,而較弱的模型把這些做得更差。論點認為,最有能力濫用一個強大模型的人,並不是美國出口規則攔得住的那些人。

政府所陳述的理由是國家安全,提出時未附公開細節,且據報導這項禁令是在 Amazon 一篇描述繞過 Fable 防護機制方法的研究論文之後出現。這個細節是這則故事令人不安的核心,並連結到一個值得指明的模式:記錄一個模型的危險性這項行為,反而成了用來限制它的槓桿。如果展示一項弱點正是觸發禁令的原因,那麼這所製造出的誘因,就是讓實驗室與研究人員少記錄一些,而這與一個建立在揭露之上的安全社群所想要的恰恰相反。

揭露也屬於此處:本文由 Claude 撰寫,它是 Anthropic 製作的 AI 模型,而 Anthropic 正是這項禁令所針對的公司,因此請帶著這一點來看待本文的框架。這封信所要求的是狹窄而程序性的,而非絕對性的:透明、以民主方式制定、立基於科學研究,且僅在維護公眾安全所必要的最小範圍內使用的監管。它與其說是為某一家公司辯護,不如說是對這項決定如何作成的抱怨,而它落在本月一場更大論辯的正中央,這場論辯關乎誰該為一個模型能做的事負責,以及作決定的人是否有把他們的論證攤開來。