DeepSeek 将其 V4 Pro 定价永久打 75% 折扣,自 2026 年 5 月 22 日生效——缓存命中输入每百万 tokens $0.003625,缓存未命中输入 $0.435/Mtok,输出 $0.87/Mtok。该模型是 DeepSeek 的旗舰,具有 1M 上下文、推理、编码和数学性能。文章未发布降价前的数字,因此对「75%」框架的独立验证需要检查 DeepSeek 自己的定价历史——但绝对价格本身是与 builder 相关的数据点。比较上下文:一个典型的 agent loop 每次调用运行 50K 输入 + 5K 输出 tokens,现在在 V4 Pro 上(缓存未命中)大约花费 $0.026,如果前缀命中缓存则基本为零。这是生产 agent 在没有激进成本工程的情况下变成单位经济为正的价格层级。

DeepSeek 引用的理由是价格降低背后的架构新闻:「高端算力容量受限」促使 V4 Pro 最初的定价是 Flash 变体成本的 12×,而此次降价与 H2 2026 华为昇腾 950 AI 芯片预期的大规模部署一致。这是 builder 一直关注的中国本土加速器故事的推理侧对应:随着昇腾产能上线,中国前沿模型的服务成本下降到即使没有台积电代工的 Nvidia 硅,也能在价格上竞争的程度。地缘政治-基础设施层(昇腾部署)塑造模型定价层(V4 Pro 降价),塑造 builder 经济层(agent 运行成本下降)。一层移动,整个栈都移动。

生态解读:价格压力故事现在是双向的。上周,微软的 Experiences + Devices 部门出于成本原因在内部放弃了 Claude Code 许可证——那是需求侧的回应。本周 DeepSeek 将 1M 上下文前沿级模型定价为 $0.87/Mtok 输出——那是供应侧的回应。成本梯度正在以六个月前没有的方式主导大型工程组织内部的模型选择对话。评估「我们标准化哪个模型」的 builder 应该用这条 DeepSeek 线在电子表格中重新计算每开发者每月的数字,特别是对于代码补全和高容量 agentic 工作负载,其中缓存命中定价基本上将成本中前缀重的部分归零。

周一上午:如果你的栈已经有 DeepSeek API 路径(大多数企业模型网关都有),V4 Pro 成本线刚刚成为市场上最便宜的 1M 上下文推理选项,以显著差距胜出。重新评估你纯粹因为它们是唯一击中你 benchmark 标准的 1M 上下文选项而路由到 GPT-5 或 Claude 4.x 的工作负载。诚实的注意事项:发布中未涉及权重状态(DeepSeek 历史上开源权重,builder 应验证 V4 Pro 的具体许可证),参数数量和架构未披露,本文未提供与西方前沿模型的基准对比。如果你在 DeepSeek 推理之上发布商业产品,数据驻留和出口管制问题属于你的法务团队的桌面,与定价数学分开。