A partir de 15 de junho, a Anthropic está dividindo a cobrança da assinatura Claude em dois pools distintos: tokens de chat para uso interativo, e um "pool de créditos programáticos" separado especificamente para tool calling agêntico. O tier Pro a $20/mês e o tier Max a $200/mês ambos incluem uma alocação programática mensal que reinicia e não acumula; tokens adicionais podem ser comprados além dos montantes incluídos. A Anthropic apresenta a mudança como isolando workloads de agentes caros do chat casual, citando o draw computacional de "múltiplos tool calls rápidos e alta demanda de raciocínio". A reação builder na cobertura do anúncio é mista; um desenvolvedor a caracteriza como "um downgrade disfarçado de feature".
O mecanismo técnico importa mais que o framing. Até agora, uma única cota de assinatura cobria tanto o chat quanto qualquer sessão Claude fazendo tool calling em loop — Claude Code, agentes Cursor, ou wrappers de terceiros como OpenClaw e Hermes que conectam Claude como cérebro de planejamento para execução contínua de ferramentas. O novo design move as sessões em loop para um contador separado. Para uma equipe rodando automação em cadência 24/7, a implicação prática é que o bucket unificado encolhe e um bucket paralelo é dimensionado para a parte agêntica. Se isso termina mais barato ou mais caro depende do ratio entre chat e uso agêntico que a equipe rodava — e a Anthropic não publicou os limites numéricos por tier no momento em que a notícia saiu, apenas os tiers em dólares.
Por que aterrissa assim: esta é a segunda mudança do lado de pricing na era Claude Code que os builders estão lendo como uma redução de cota disfarçada. Os episódios de rate-limiting "5-hour window" mais cedo neste ano, e o flip do default de retenção de dados em agosto de 2025, deixaram a base de usuários cautelosa de qualquer mudança apresentada como "enabling agentic workloads at scale". O padrão que atrai o fogo é a bifurcação: separar o que era unificado em pools que cada um parece menor. O argumento da Anthropic é que operações agênticas sempre iam ser cobradas separadamente em escala, e o pool dedicado torna isso explícito em vez de produzir excedentes surpresa. Ambas leituras são defensáveis no estágio de anúncio; o teste real é se os números de crédito por tier publicados deixam espaço para os workloads que as pessoas já estão rodando.
Para builders: orce para dois pools em vez de um indo para 15 de junho. Audite seu uso de Claude agora separando requisições estilo chat de sessões em loop de agente — Claude Code, workflows pilotados por servidor MCP, qualquer coisa que dispara tool calls em loop sustentado — e verifique como o ratio se parece em uma semana típica. Se a nova alocação programática não bater com esse ratio, você tem um mês para ou comprimir o workload agêntico, planejar compras adicionais de tokens, ou avaliar provedores alternativos para os paths loop-heavy. Os limites numéricos completos por tier são o que assistir nas próximas duas semanas; os tiers em dólares sozinhos não contam a história toda.
