OpenAI与Broadcom发布了Jalapeno,这是OpenAI的首款定制AI芯片,一款专为运行大型语言模型而非训练它们而打造的加速器。两家公司均确认了这一消息,并将其定位为双方共同打造的跨多代计算平台迈出的第一步。这样一款芯片的意义既狭窄又重要:推理,也就是实际回答提示词的工作,是模型部署后大部分成本的所在,而一款只为这项任务调优的芯片可以比通用GPU更便宜地完成它。

最引人注目的细节是它成型的速度。OpenAI与Broadcom表示,他们从最初设计到制造流片仅用了大约九个月,并形容这可能是此类高性能芯片有史以来所实现过的最快开发周期。按OpenAI的说法,让这种速度成为可能的部分原因,是公司使用自家模型来加速了设计与优化流程中的若干环节。这本身就是一个低调却值得注意的说法:一家AI实验室用自己当下的模型,来帮助打造将运行其下一代模型的硬件。

在技术层面,该架构瞄准的是真正限制推理性能的东西,也就是数据的搬运而非纯算力。Jalapeno旨在减少这种数据搬运,并平衡算力、内存与网络,使真实利用率更接近理论峰值,而大多数芯片在这一点上远远不及。早期测试,同样出自OpenAI自己,显示其每瓦性能大幅优于当前最先进水平。计划是在2026年底进行初步部署,并在此后数年扩展,有报道称Microsoft将拿下约40%的产量。

这件事之所以重要,远不止一款芯片。Nvidia对AI的掌控,建立在向几乎所有训练和运行模型的人出售GPU之上,其利润率让每一个被服务的token都成为向上游的付款。Google打造了它的TPU,Amazon打造了Trainium和Inferentia,正是出于同样的原因:在OpenAI这样的规模下,自研芯片比永远租用别人的更便宜。Jalapeno就是OpenAI加入这个俱乐部,是一次拥有其产品之下更多技术栈的尝试,从而让提供智能的成本更低,也更少依赖单一供应商。

诚实的解读伴随着局限。这是一款推理加速器,而非训练芯片,因此它并未触及Nvidia最为根深蒂固的那部分流程。性能数据出自OpenAI自己,尚未经过独立测试,芯片也还未大规模运行,而且定制芯片素有在幻灯片上比在数据中心里更好看的悠久历史。但九个月的时间线、一个有名有姓的超大规模买家以及清晰的战略动机三者结合,让这个信号难以忽视。那些有能力自研芯片的公司正在这么做,而AI领域中谁向谁付钱的经济格局正开始发生转变。