O GitHub Copilot está migrando para cobrança por token em 1 de junho de 2026, encerrando o modelo "Premium Requests" de tarifa fixa que agrupava chamadas de agente programador numa cota mensal fixa. Sob a nova estrutura, Copilot Pro a $10/mês vira 1.000 AI Credits, onde um crédito equivale a um centavo de dólar à taxa atual. Code completions e sugestões Next Edit continuam grátis; todo o resto — Chat, corridas de agente, seleção de modelo — é medido.

A mudança importa porque o modelo antigo era abusado nas duas pontas. Uma tarefa de agente autônomo de várias horas contava como uma Premium Request; uma pergunta trivial contava o mesmo. O modelo novo ata o custo ao volume real de tokens — entrada, saída, cache hits, tipo de função — com taxas que variam por modelo. O GitHub não publicou a tabela de tarifas por modelo, mas a implicação é direta: corridas de agente classe Claude Sonnet custam mais por crédito que completions classe Haiku, e qualquer time que construiu workflows em torno da abstração "Premium Request" agora precisa modelar gasto em tokens em vez de gasto em assentos. Data efetiva: 1 de junho de 2026.

Essa é a economia de wrappers alcançando sua própria infraestrutura. Ferramentas dev de tarifa fixa eram viáveis quando custos de API eram fortemente subsidiados por VC e quando o stack de agente era fino. Modelos de raciocínio e traces de agente de longa execução quebraram essa matemática — um agente programador fazendo rollouts de 100K tokens num refactor complexo é genuinamente um perfil de custo diferente de um completion de 200 tokens. O GitHub repassando os custos é preço honesto; também é uma abertura competitiva para ferramentas que oferecem alternativas de tarifa fixa ou auto-hospedadas, porque toda dev shop com uma linha Copilot acabou de ter uma surpresa orçamentária.

Se você entrega código com Copilot no seu stack, instrumente antes de 1 de junho: registre volumes de Chat, agente e uso de ferramentas para estimar gasto em tokens nas novas taxas. Se não conseguir uma estimativa limpa do GitHub, fixe um teto duro de créditos por desenvolvedor no primeiro mês e ajuste. Continue auto-hospedado com modelos de pesos abertos é uma alternativa crível para shops com capacidade de ops. Para todos os outros, a resposta é a mesma de sempre quando um medidor por chamada aparece: meça primeiro, otimize os loops que movem a conta.