Claude Opus 4.7 發布：SWE-bench Verified 87.6%、2576 像素視覺、多 agent /ultrareview、新增 xhigh 努力級別

Anthropic 於 4 月 16 日發布 Claude Opus 4.7，這是自 Opus 4.6 以來首個普遍可用的版本，也是本月早些時候引發網安頭條的受限 Mythos Preview 的生產版姐妹。它同時登陸 Claude Platform、Amazon Bedrock、Google Cloud Vertex AI 與 Microsoft Foundry，是 Anthropic 至今最乾淨的一次多雲同步發布。VentureBeat 把它框定為以微弱優勢重奪「最強通用可得 LLM」頭銜。

真正值得留意的是跑分差值。SWE-bench Verified 升到 87.6%，較 Opus 4.6 的 80.8% 上升。SWE-bench Pro（更難的變體）落在 64.3%。CursorBench 升到 70%，較之前的 58% 上升。GPQA Diamond 到 94.2%。不過功能集比數字更重要。新的 xhigh 努力級別讓每一輪對話可調用更多算力。任務預算允許你給單個任務的消耗設置上限。/ultrareview 是一個多 agent 程式碼評審功能，延續了我們上週報導 Gemini CLI 發布子 agent 時所說的子 agent 原語收斂。視覺輸入長邊上限為 2576 像素（約 3.75 百萬像素），使 Opus 4.7 成為首個支援高解析度影像的 Claude 模型。1M token 上下文與 128k 輸出上限延續自 4.6。價格保持在每百萬 token 輸入 5 美元、輸出 25 美元。

兩件事值得指出。其一，SWE-bench Verified 的 87.6% 相對 Opus 4.6 是一個週期內 7 個點的跳躍，幅度大於近期多數 Claude 版本。CursorBench 的變化（58 到 70）在相對幅度上更大。Anthropic 在 agentic 編碼上的押注仍是產品獲得最多投入的地方，而 /ultrareview 多 agent 評審功能就是直接證據。其二，Bedrock、Vertex 與 Microsoft Foundry 的同步發布說明：Anthropic 的「深度綁 AWS 同時所有主要雲都可用」姿態，並不是有些人從 250 億美元亞馬遜加碼中讀出的雲獨家。Claude 在產品層面仍是真正的多雲，哪怕開支集中是單向的。

如果你在跑編碼 agent，實用含意很直接。Opus 4.7 在每一個主要 API 面上都是與 4.6 同價的直接替換。/ultrareview 是值得最先嘗試的功能——把多 agent 程式碼評審內建進模型，讓子 agent 模式從一個配置步驟變成預設。2576 像素的視覺升級解鎖了此前因降採樣而受限的截圖除錯工作流。如果你在偏好 Bedrock 或 Vertex 的合規環境，發布當日即同步意味著你可以用現有的雲原生姿態採用 4.7。那個在研究預覽裡交出 Mythos 級網安成績的模型，現在以低一級的身位進入了普遍可得。

Claude Opus 4.7 發布：SWE-bench Verified 87.6%、2576 像素視覺、多 agent /ultrareview、新增 xhigh 努力級別

更多新聞