A partir del 15 de junio, Anthropic está dividiendo la facturación de suscripción de Claude en dos pools distintos: tokens de chat para uso interactivo, y un "pool de créditos programáticos" separado específicamente para tool calling agéntico. El tier Pro a $20/mes y el tier Max a $200/mes ambos incluyen una asignación programática mensual que se reinicia y no se acumula; tokens adicionales pueden ser comprados más allá de los montos incluidos. Anthropic presenta el cambio como aislando workloads de agentes costosos del chat casual, citando el draw computacional de "múltiples tool calls rápidos y alta demanda de razonamiento". La reacción builder en la cobertura del anuncio es mixta; un desarrollador la caracteriza como "un downgrade disfrazado de feature".
El mecanismo técnico importa más que el framing. Hasta ahora, un solo cuota de suscripción cubría tanto el chat como cualquier sesión Claude haciendo tool calling en loop — Claude Code, agentes Cursor, o wrappers de terceros como OpenClaw y Hermes que conectan Claude como cerebro de planificación para ejecución continua de herramientas. El nuevo diseño mueve las sesiones de loop a un contador separado. Para un equipo corriendo automatización en cadencia 24/7, la implicación práctica es que el bucket unificado se reduce y un bucket paralelo se dimensiona para la parte agéntica. Si esto termina más barato o más caro depende del ratio entre chat y uso agéntico que el equipo corría — y Anthropic no ha publicado los límites numéricos por tier al momento que salió la noticia, solo los tiers en dólares.
Por qué aterriza así: este es el segundo cambio del lado de pricing en la era Claude Code que los builders están leyendo como una reducción de cuota encubierta. Los episodios de rate-limiting "5-hour window" más temprano este año, y el flip del default de retención de datos en agosto 2025, han hecho a la base de usuarios cautelosa de cualquier cambio presentado como "enabling agentic workloads at scale". El patrón que atrae el fuego es la bifurcación: separar lo que estaba unificado en pools que cada uno se ve más pequeño. El argumento de Anthropic es que las operaciones agénticas siempre iban a ser tarifadas separadamente a escala, y el pool dedicado hace eso explícito en lugar de producir sobrecostos sorpresa. Ambas lecturas son defendibles en la etapa de anuncio; la prueba real es si los números de crédito por tier publicados dejan espacio para los workloads que la gente ya está corriendo.
Para builders: presupuesta para dos pools en lugar de uno yendo hacia el 15 de junio. Audita tu uso de Claude ahora separando solicitudes estilo chat de sesiones en loop de agente — Claude Code, workflows manejados por servidor MCP, cualquier cosa que dispara tool calls en loop sostenido — y verifica cómo se ve el ratio en una semana típica. Si la nueva asignación programática no coincide con ese ratio, tienes un mes para o comprimir el workload agéntico, planear compras adicionales de tokens, o evaluar proveedores alternativos para los paths loop-heavy. Los límites numéricos completos por tier son lo que hay que vigilar en las próximas dos semanas; los tiers en dólares solos no cuentan toda la historia.
