Snowflake簽署了為期五年、60億美元的AWS Graviton ARM CPU容量承諾。公告中提到的戰略劃分是「GPU處理訓練和推理,而CPU處理AI相關的大部分其他任務,特別是agent」。這是頭條經濟數字下的builder-frame故事——超大規模客戶正在以供應承諾規模購買CPU,因為agent工作負載是CPU-bound而非GPU-bound。每年12億美元的執行率將ARM CPU放在了與主導AI capex對話的GPU合約相同的採購類別中。

ARM CPU與agent stack匹配的架構原因是工作負載形狀。一個agent的大部分wall-clock是工具dispatch、檢索編排、JSON解析、驗證邏輯、prompt組裝,以及包裝一次LLM推理呼叫的十二步狀態機。單次推理呼叫需要GPU記憶體頻寬;圍繞它的十一步需要規模化的低延遲CPU週期。AWS Graviton的price-performance定位多年來已經透過通用伺服器工作負載得到驗證,但agent stack是相同經濟學開始應用於AI標記支出的地方。Snowflake的承諾也是Cortex AI訊號——他們的文字介面到資料庫產品就是那種主要在CPU上執行、帶有間歇性GPU呼叫的agent工作負載。

建構者的生態系統解讀:媒體中的CPU-cloud vs GPU-Nvidia框架是錯誤的二分法。正確的解讀是「agent是CPU重型加GPU爆發」——而比例取決於你在agent loop的哪一步進行instrumentation。超大規模廠商(AWS Graviton、Azure Cobalt、Google Axion)正在將ARM定位為AI支出CPU重型部分的基底,這部分在簡單聊天之外的任何應用程式中在結構上都比GPU重型部分更大。公告中沒有針對Nvidia GPU在agent-loop wall-clock上的頭對頭比較,這是要標記的方法論差距。論點是經濟-架構性的,而不是基準驗證的。Snowflake的60億美元承諾是一票,表明經濟案例足夠強大,可以在不等待公開基準的情況下採購。

如果你週一早上建構agent基礎設施:測量你實際的agent wall-clock CPU-to-GPU比率,然後相應地選擇instance類型。「AI工作負載=GPU instance」的假設在agent-重型服務上要花錢。如果你銷售agent平台:與企業客戶的每-token經濟學對話正從原始推理成本轉向總agent-loop計算混合,ARM CPU定價是該推介的一部分。