Nutanix在.NEXT 2026大會上宣布擴展其Agentic AI平台功能,專門鎖定圍繞隨選GPU存取建立業務的新興「新雲廠商」。該平台與Nvidia AI Enterprise整合,承諾透過將於2026年下半年推出的多租戶AI管理入口網站降低token成本。Nutanix產品管理執行副總裁Thomas Cornely將此定位為新雲廠商從服務「少量企業客戶」轉向為生產AI應用程式擴展推理工作負載的關鍵。
此舉措反映了AI基礎建設經濟學的真正轉變。雖然第一波AI雲端服務商透過出租GPU進行訓練運行賺錢,但推理遊戲不同——它關乎高效服務數百萬API呼叫,而非為一次性模型訓練消耗運算力。Token成本正成為新的瓶頸,誰能大規模提供更便宜的推理服務,誰就贏得企業AI市場。
此時機與業界對AI基礎建設成本的更廣泛壓力相一致。多個消息來源證實,新雲廠商正爭相從簡單GPU租賃轉向能夠處理企業安全、治理和成本可預測性要求的託管AI服務。Nutanix押注這些提供商需要完整平台而非拼湊點解決方案——考慮到代理式AI部署變得如此複雜,這是合理的押注。
對於建構生產AI應用程式的開發者而言,這表明基礎建設提供商終於開始認真對待token經濟學。如果Nutanix兌現降低成本的承諾,它可能透過讓推理工作負載在規模上經濟可行來加速企業採用代理式AI。
