一個Claude Max訂閱用戶在短短23天內消耗了價值2.7萬美元的compute資源,卻只支付了200美元的訂閱費,暴露了研究人員所稱的驚人「25倍訂閱陷阱」,揭示了前沿AI實驗室是如何在補貼巨額虧損的。這不是孤立事件——隨著重度用戶更加激進地使用AI模型,消耗成本比常規output token高5-10倍的reasoning token,而訂閱模式仍與實際運算成本脫節,這正在成為常態。
這一差距凸顯了AI經濟運作方式的根本轉變。雖然NVIDIA推廣「每token成本」作為AI基礎設施唯一重要的指標,論證企業應該關注token輸出而非原始compute規格,但現實是大多數用戶根本不知道他們實際的token消耗成本。input token(最便宜)、output token(中等)和reasoning token(昂貴)之間的區別創造了定價複雜性,而當前的訂閱模式完全忽視了這一點,導致供應商的單位經濟學不可持續。
企業影響是嚴峻的:隨著AI工作負載擴大和推理密集型應用成為標準,當前的補貼AI存取模式將會崩塌。構建AI產品的公司需要現在就了解他們真實的token經濟學,在供應商不可避免地提高價格或施加更嚴格的使用限制之前。讓無限用戶燒掉昂貴compute資源的健身房會員制模式,根本無法在現實世界使用模式和大規模交付智慧的實際成本面前存活。
