Google Cloud和Intel在周四扩大了他们的多年合作伙伴关系,深化了在定制基础设施处理单元(IPU)方面的合作,并承诺采用Intel最新的Xeon 6处理器用于AI推理工作负载。这项协议建立在2021年开始的芯片开发合作伙伴关系基础上,专注于基于ASIC的定制IPU,旨在将数据中心任务从CPU中卸载——解决Intel CEO谭力生所说的需要"平衡系统"而不仅仅是加速器的需求。

这一举措突出了整个行业正在发生的战略转变。虽然GPU短缺占据头条新闻,但真正的基础设施危机正围绕大规模AI推理所需的CPU出现。训练获得了关注,但推理才是真正业务发生的地方——而这是CPU密集型工作。SoftBank旗下的Arm Holdings刚刚在这场"全球危机"中宣布了其首个自产AGI CPU,表明芯片公司将CPU短缺视为下一个主要瓶颈。

值得注意的是这种合作伙伴关系如何融入Google更广泛的基础设施战略。最近的交易显示Google Cloud正在通过AI合作伙伴关系积极争取企业客户——从Adobe的创意AI整合到Liberty Global五年期欧洲电信转型。这些不仅仅是云合同;它们是在押注谁控制推理基础设施就将控制企业级AI部署。

对于开发者来说,这指向一个实际现实:开始为AI应用中的CPU约束进行规划。GPU短缺教会我们优化训练效率,但即将到来的CPU危机意味着重新思考推理架构。定制IPU和专用处理器不再只是企业奢侈品——它们正成为任何严肃AI部署的必要基础设施。