Nutanix在.NEXT 2026大会上宣布扩展其Agentic AI平台功能,专门瞄准围绕按需GPU访问构建业务的新兴"新云厂商"。该平台与Nvidia AI Enterprise集成,承诺通过将于2026年下半年推出的多租户AI管理门户降低token成本。Nutanix产品管理执行副总裁Thomas Cornely将此定位为新云厂商从服务"少量企业客户"转向为生产AI应用扩展推理工作负载的关键。

这一举措反映了AI基础设施经济学的真正转变。虽然第一波AI云服务商通过出租GPU进行训练运行赚钱,但推理游戏不同——它关乎高效服务数百万API调用,而非为一次性模型训练消耗算力。Token成本正成为新的瓶颈,谁能大规模提供更便宜的推理服务,谁就赢得企业AI市场。

这一时机与行业对AI基础设施成本的更广泛压力相一致。多个消息来源证实,新云厂商正在争相从简单GPU租赁转向能够处理企业安全、治理和成本可预测性要求的托管AI服务。Nutanix押注这些提供商需要完整平台而非拼凑点解决方案——考虑到AI智能体部署变得如此复杂,这是合理的押注。

对于构建生产AI应用的开发者来说,这表明基础设施提供商终于开始认真对待token经济学。如果Nutanix兑现降低成本的承诺,它可能通过让推理工作负载在规模上经济可行来加速企业采用AI智能体。