一个Claude Max订阅用户在短短23天内消耗了价值2.7万美元的compute资源,却只支付了200美元的订阅费,暴露了研究人员所称的惊人"25倍订阅陷阱",揭示了前沿AI实验室是如何在补贴巨额亏损的。这不是孤立事件——随着重度用户更加激进地使用AI模型,消耗成本比常规output token高5-10倍的reasoning token,而订阅模式仍与实际计算成本脱节,这正在成为常态。

这一差距凸显了AI经济运作方式的根本转变。虽然NVIDIA推广"每token成本"作为AI基础设施唯一重要的指标,论证企业应该关注token输出而非原始compute规格,但现实是大多数用户根本不知道他们实际的token消耗成本。input token(最便宜)、output token(中等)和reasoning token(昂贵)之间的区别创造了定价复杂性,而当前的订阅模式完全忽视了这一点,导致供应商的单位经济学不可持续。

企业影响是严峻的:随着AI工作负载扩大和推理密集型应用成为标准,当前的补贴AI访问模式将会崩塌。构建AI产品的公司需要现在就了解他们真实的token经济学,在供应商不可避免地提高价格或施加更严格的使用限制之前。让无限用户烧掉昂贵compute资源的健身房会员制模式,根本无法在现实世界使用模式和大规模交付智能的实际成本面前存活。