GitHub Copilot passe à la facturation au token le 1er juin 2026, mettant fin au modèle « Premium Requests » à tarif fixe qui regroupait les appels d'agent codant dans une allocation mensuelle fixe. Sous la nouvelle structure, Copilot Pro à 10$/mois se convertit en 1 000 AI Credits, où un crédit vaut un cent US au taux courant. Les complétions de code et les suggestions Next Edit restent gratuites; tout le reste — Chat, exécutions d'agent, sélection de modèle — est compté.

Le changement compte parce que l'ancien modèle était abusé des deux côtés. Une tâche d'agent autonome de plusieurs heures comptait pour une seule Premium Request; une question triviale comptait pareil. Le nouveau modèle attache le coût au volume de tokens réel — entrée, sortie, cache hits, type de fonction — avec des taux qui varient selon le modèle. GitHub n'a pas publié la grille tarifaire par modèle, mais l'implication est directe : les exécutions d'agent classe Claude Sonnet coûtent plus cher par crédit que les complétions classe Haiku, et toute équipe qui a bâti des workflows autour de l'abstraction « Premium Request » doit maintenant modéliser la dépense en tokens plutôt qu'en sièges. Date d'effet : 1er juin 2026.

C'est l'économie des wrappers qui rattrape sa propre infrastructure. Les outils dev à tarif fixe étaient viables quand les coûts API étaient massivement subventionnés par le VC et quand le stack agent était mince. Les modèles de raisonnement et les traces d'agent à long fil ont cassé ce calcul — un agent codant qui fait des rollouts de 100K tokens sur un refactor complexe est un profil de coût vraiment différent d'une complétion de 200 tokens. GitHub qui répercute les coûts, c'est de la tarification honnête; c'est aussi une ouverture compétitive pour les outils qui offrent des alternatives à tarif fixe ou auto-hébergées, parce que tout shop dev avec une ligne Copilot vient d'avoir une surprise budgétaire.

Si tu livres du code avec Copilot dans ton stack, instrumente avant le 1er juin : log les volumes de Chat, d'agent et d'usage d'outils pour estimer la dépense en tokens aux nouveaux taux. Si tu n'arrives pas à une estimation propre depuis GitHub, fixe un plafond crédit dur par développeur le premier mois et ajuste. Continue auto-hébergé avec des modèles à poids ouverts est une alternative crédible pour les shops avec la capacité ops. Pour tout le monde, la réponse est la même qu'à chaque fois qu'un compteur à l'appel apparaît : mesure d'abord, optimise les boucles qui font bouger la facture.