Claude Opus 4.7 发布：SWE-bench Verified 87.6%、2576 像素视觉、多 agent /ultrareview、新增 xhigh 努力级别

Anthropic 于 4 月 16 日发布 Claude Opus 4.7，这是自 Opus 4.6 以来首个普遍可用的版本，也是本月早些时候引发网安头条的受限 Mythos Preview 的生产版姐妹。它同时登陆 Claude Platform、Amazon Bedrock、Google Cloud Vertex AI 与 Microsoft Foundry，是 Anthropic 至今最干净的一次多云同步发布。VentureBeat 把它框定为以微弱优势重夺「最强通用可得 LLM」头衔。

真正值得留意的是跑分差值。SWE-bench Verified 升到 87.6%，较 Opus 4.6 的 80.8% 上升。SWE-bench Pro（更难的变体）落在 64.3%。CursorBench 升到 70%，较之前的 58% 上升。GPQA Diamond 到 94.2%。不过功能集比数字更重要。新的 xhigh 努力级别让每一轮对话可调用更多算力。任务预算允许你给单个任务的消耗设置上限。/ultrareview 是一个多 agent 代码评审功能，延续了我们上周报道 Gemini CLI 发布子 agent 时所说的子 agent 原语收敛。视觉输入长边上限为 2576 像素（约 3.75 百万像素），使 Opus 4.7 成为首个支持高解析度图像的 Claude 模型。1M token 上下文与 128k 输出上限延续自 4.6。价格保持在每百万 token 输入 5 美元、输出 25 美元。

两件事值得指出。其一，SWE-bench Verified 的 87.6% 相对 Opus 4.6 是一个周期内 7 个点的跳跃，幅度大于近期多数 Claude 版本。CursorBench 的变化（58 到 70）在相对幅度上更大。Anthropic 在 agentic 编码上的押注仍是产品获得最多投入的地方，而 /ultrareview 多 agent 评审功能就是直接证据。其二，Bedrock、Vertex 与 Microsoft Foundry 的同步发布说明：Anthropic 的「深度绑 AWS 同时所有主要云都可用」姿态，并不是有些人从 250 亿美元亚马逊加码中读出的云独家。Claude 在产品层面仍是真正的多云，哪怕开支集中是单向的。

如果你在跑编码 agent，实用含义很直接。Opus 4.7 在每一个主要 API 面上都是与 4.6 同价的直接替换。/ultrareview 是值得最先尝试的功能——把多 agent 代码评审内建进模型，让子 agent 模式从一个配置步骤变成默认。2576 像素的视觉升级解锁了此前因下采样而受限的截图调试工作流。如果你在偏好 Bedrock 或 Vertex 的合规环境，发布当日即同步意味着你可以用现有的云原生姿态采用 4.7。那个在研究预览里交出 Mythos 级网安成绩的模型，现在以低一级的身位进入了普遍可得。

Claude Opus 4.7 发布：SWE-bench Verified 87.6%、2576 像素视觉、多 agent /ultrareview、新增 xhigh 努力级别

更多新闻