À partir du 15 juin, Anthropic divise la facturation des abonnements Claude en deux pools distincts : tokens de chat pour l'usage interactif, et un « pool de crédits programmatiques » séparé spécifiquement pour le tool calling agentique. Le tier Pro à 20$/mois et le tier Max à 200$/mois incluent tous deux une allocation programmatique mensuelle qui se réinitialise et ne se reporte pas ; des tokens additionnels peuvent être achetés au-delà des montants inclus. Anthropic présente le changement comme isolant les workloads d'agents coûteux du chat casual, citant le tirage computationnel de « multiples tool calls rapides et forte demande de raisonnement ». La réaction builder dans la couverture de l'annonce est mitigée ; un développeur la caractérise comme « un downgrade déguisé en feature ».

Le mécanisme technique compte plus que le framing. Jusqu'ici, un seul quota d'abonnement couvrait à la fois le chat et toute session Claude faisant du tool calling en boucle — Claude Code, agents Cursor, ou wrappers tiers comme OpenClaw et Hermes qui connectent Claude comme cerveau de planification pour l'exécution continue d'outils. Le nouveau design déplace les sessions en boucle vers un compteur séparé. Pour une équipe qui roule de l'automation en cadence 24/7, l'implication pratique c'est que le bucket unifié rétrécit et un bucket parallèle est dimensionné pour la part agentique. Que ça finisse moins cher ou plus cher dépend du ratio entre chat et usage agentique que l'équipe roulait — et Anthropic n'a pas publié les limites numériques par tier au moment où la nouvelle est sortie, juste les tiers en dollars.

Pourquoi ça atterrit comme ça : c'est le deuxième changement côté pricing de l'ère Claude Code que les builders lisent comme une réduction de quota déguisée. Les épisodes de rate-limiting « 5-hour window » plus tôt cette année, et le flip du défaut de rétention de données en août 2025, ont rendu la base utilisateur méfiante de tout changement présenté comme « enabling agentic workloads at scale ». Le pattern qui attire le feu c'est la bifurcation : séparer ce qui était unifié en pools qui paraissent chacun plus petits. L'argument d'Anthropic c'est que les opérations agentiques allaient toujours être tarifées séparément à l'échelle, et le pool dédié rend ça explicite plutôt que de produire des dépassements surprise. Les deux lectures sont défendables au stade de l'annonce ; le vrai test c'est de savoir si les chiffres de crédits par tier publiés laisseront de la place pour les workloads que les gens roulent déjà.

Pour les builders : budgète pour deux pools au lieu d'un en allant vers le 15 juin. Audite ton usage Claude maintenant en séparant les requêtes style chat des sessions en boucle d'agent — Claude Code, workflows pilotés par serveur MCP, n'importe quoi qui tire du tool calling en boucle soutenue — et vérifie à quoi ressemble le ratio sur une semaine typique. Si la nouvelle allocation programmatique ne matche pas ce ratio, t'as un mois pour soit compresser le workload agentique, planifier des achats de tokens additionnels, ou évaluer des providers alternatifs pour les paths loop-heavy. Les limites numériques complètes par tier sont ce qu'il faut surveiller dans les deux prochaines semaines ; les tiers en dollars seuls ne disent pas toute l'histoire.