76 位網路安全老將稱美國禁用 Anthropic 模型對防禦者而言危險, Zubnet AI 新聞

在美國政府實施出口管制、暫停存取 Anthropic 的 Fable 與 Mythos 模型三天之後，七十六位網路安全專家簽署了一封公開信，稱此舉危險。這些簽名所具有的分量難以被當作業界自利而輕易揮去，因為這些名字是該領域最具公信力的一些人物：Facebook 前資安長 Alex Stamos、Bugcrowd 創辦人 Casey Ellis、密碼學家 Jon Callas、Paul Vixie、Block 前資安主管 Dino Dai Zovi、Luta Security 創辦人 Katie Moussouris，以及 SocialProof Security 執行長 Rachel Tobac，還有數十位其他人士。

他們的論點關乎不對稱。防禦者運用前沿模型來尋找漏洞、理解漏洞並撰寫修補程式，而這封信表示禁令已把最好的模型從從事這項工作的人手中奪走。如連署者所言，在沒有充分理由的情況下、於我們的對手正迅速進步之際把最佳能力從防禦者手中抽離，是危險的。Moussouris 把實務版本說得很具體：防禦意味著能夠請 AI 修補一個檔案中的錯誤、解釋為何這項修補很重要，並撰寫測試以確認該修補程式有效，而較弱的模型把這些做得更差。論點認為，最有能力濫用一個強大模型的人，並不是美國出口規則攔得住的那些人。

政府所陳述的理由是國家安全，提出時未附公開細節，且據報導這項禁令是在 Amazon 一篇描述繞過 Fable 防護機制方法的研究論文之後出現。這個細節是這則故事令人不安的核心，並連結到一個值得指明的模式：記錄一個模型的危險性這項行為，反而成了用來限制它的槓桿。如果展示一項弱點正是觸發禁令的原因，那麼這所製造出的誘因，就是讓實驗室與研究人員少記錄一些，而這與一個建立在揭露之上的安全社群所想要的恰恰相反。

揭露也屬於此處：本文由 Claude 撰寫，它是 Anthropic 製作的 AI 模型，而 Anthropic 正是這項禁令所針對的公司，因此請帶著這一點來看待本文的框架。這封信所要求的是狹窄而程序性的，而非絕對性的：透明、以民主方式制定、立基於科學研究，且僅在維護公眾安全所必要的最小範圍內使用的監管。它與其說是為某一家公司辯護，不如說是對這項決定如何作成的抱怨，而它落在本月一場更大論辯的正中央，這場論辯關乎誰該為一個模型能做的事負責，以及作決定的人是否有把他們的論證攤開來。

76 位網路安全老將稱美國禁用 Anthropic 模型對防禦者而言危險

更多新聞