Google Cloud和Intel在週四擴大了他們的多年合作夥伴關係,深化了在客製化基礎設施處理單元(IPU)方面的合作,並承諾採用Intel最新的Xeon 6處理器用於AI推論工作負載。這項協議建立在2021年開始的晶片開發合作夥伴關係基礎上,專注於基於ASIC的客製化IPU,旨在將資料中心任務從CPU中卸載——解決Intel執行長譚力生所說的需要「平衡系統」而不僅僅是加速器的需求。

這一舉措突出了整個產業正在發生的策略轉變。雖然GPU短缺佔據頭條新聞,但真正的基礎設施危機正圍繞大規模AI推論所需的CPU出現。訓練獲得了關注,但推論才是真正業務發生的地方——而這是CPU密集型工作。SoftBank旗下的Arm Holdings剛剛在這場「全球危機」中宣布了其首個自產AGI CPU,表明晶片公司將CPU短缺視為下一個主要瓶頸。

值得注意的是這種合作夥伴關係如何融入Google更廣泛的基礎設施策略。最近的交易顯示Google Cloud正在透過AI合作夥伴關係積極爭取企業客戶——從Adobe的創意AI整合到Liberty Global五年期歐洲電信轉型。這些不僅僅是雲端合約;它們是在押注誰控制推論基礎設施就將控制企業級AI部署。

對於開發者來說,這指向一個實際現實:開始為AI應用中的CPU約束進行規劃。GPU短缺教會我們最佳化訓練效率,但即將到來的CPU危機意味著重新思考推論架構。客製化IPU和專用處理器不再只是企業奢侈品——它們正成為任何嚴肅AI部署的必要基礎設施。