DeepSeek 將其 V4 Pro 定價永久打 75% 折扣,自 2026 年 5 月 22 日生效——快取命中輸入每百萬 tokens $0.003625,快取未命中輸入 $0.435/Mtok,輸出 $0.87/Mtok。該模型是 DeepSeek 的旗艦,具有 1M 上下文、推理、編碼和數學性能。文章未發布降價前的數字,因此對「75%」框架的獨立驗證需要檢查 DeepSeek 自己的定價歷史——但絕對價格本身是與 builder 相關的資料點。比較上下文:一個典型的 agent loop 每次呼叫執行 50K 輸入 + 5K 輸出 tokens,現在在 V4 Pro 上(快取未命中)大約花費 $0.026,如果前綴命中快取則基本為零。這是生產 agent 在沒有激進成本工程的情況下變成單位經濟為正的價格層級。

DeepSeek 引用的理由是價格降低背後的架構新聞:「高端算力容量受限」促使 V4 Pro 最初的定價是 Flash 變體成本的 12×,而此次降價與 H2 2026 華為昇騰 950 AI 晶片預期的大規模部署一致。這是 builder 一直關注的中國本土加速器故事的推理側對應:隨著昇騰產能上線,中國前沿模型的服務成本下降到即使沒有台積電代工的 Nvidia 矽,也能在價格上競爭的程度。地緣政治-基礎建設層(昇騰部署)塑造模型定價層(V4 Pro 降價),塑造 builder 經濟層(agent 執行成本下降)。一層移動,整個棧都移動。

生態解讀:價格壓力故事現在是雙向的。上週,微軟的 Experiences + Devices 部門出於成本原因在內部放棄了 Claude Code 授權——那是需求側的回應。本週 DeepSeek 將 1M 上下文前沿級模型定價為 $0.87/Mtok 輸出——那是供應側的回應。成本梯度正在以六個月前沒有的方式主導大型工程組織內部的模型選擇對話。評估「我們標準化哪個模型」的 builder 應該用這條 DeepSeek 線在試算表中重新計算每開發者每月的數字,特別是對於程式碼補全和高容量 agentic 工作負載,其中快取命中定價基本上將成本中前綴重的部分歸零。

週一早上:如果你的棧已經有 DeepSeek API 路徑(大多數企業模型閘道都有),V4 Pro 成本線剛剛成為市場上最便宜的 1M 上下文推理選項,以顯著差距勝出。重新評估你純粹因為它們是唯一擊中你 benchmark 標準的 1M 上下文選項而路由到 GPT-5 或 Claude 4.x 的工作負載。誠實的注意事項:發布中未涉及權重狀態(DeepSeek 歷史上開源權重,builder 應驗證 V4 Pro 的具體授權),參數數量和架構未揭露,本文未提供與西方前沿模型的基準對比。如果你在 DeepSeek 推理之上發布商業產品,資料駐留和出口管制問題屬於你的法務團隊的桌面,與定價數學分開。