GitHub Copilot 将在 2026 年 6 月 1 日切换到按 token 计费,结束把编码代理调用打包进固定月度配额的"Premium Requests"统一费率模式。新结构下,10 美元/月的 Copilot Pro 折算为 1 000 AI Credits,按当前汇率一个 credit 抵一美分。代码补全与 Next Edit 建议仍免费;其余 —— 聊天、代理运行、模型选择 —— 都计量收费。

这个变动之所以重要,是因为旧模式两头都被滥用。一个跑几小时的自主代理任务记一次 Premium Request;一个琐碎的问答也记一次。新模式把成本绑到真实的 token 数量上 —— 输入、输出、cache 命中、功能类型 —— 费率因模型而异。GitHub 还没公开按模型的价目表,但含义直接:Claude Sonnet 级的代理运行,每 credit 的成本要高于 Haiku 级的补全;任何把工作流绑定在"Premium Request"抽象上的团队,现在得改用 token 支出而不是席位支出来建模。生效日期:2026 年 6 月 1 日。

这就是包装层经济追上它自己的基础设施。统一费率的开发工具在 API 成本被 VC 高度补贴、代理栈还很薄的年代是说得通的。推理类模型和长链路代理调用打破了这套算术 —— 一个在复杂重构上跑 10 万 token rollout 的编码代理,在成本曲线上跟 200 token 的补全完全是两码事。GitHub 把成本透传过去是诚实的定价;同时也给那些提供固定费率或自托管替代方案的工具开了一道竞争口子,因为每一个有 Copilot 这一行预算的开发团队,都刚刚收到了一个预算意外。

如果你的栈里用 Copilot 出货代码,在 6 月 1 日之前先做埋点:记录 Chat、代理和工具调用的体量,以便按新费率估算 token 支出。如果没法从 GitHub 拿到干净的预估,第一个月给每位开发者设一个硬性的 credit 上限,然后再调。配合开放权重模型自托管 Continue,对运维能力到位的团队是个可信替代。对其他人来说,答案跟所有按调用计费表第一次出现时一样:先量,再优化那些会推动账单的循环。