GitHub Copilot está pasando a facturación por token el 1 de junio de 2026, terminando el modelo "Premium Requests" de tarifa plana que agrupaba llamadas de agente codificador en una asignación mensual fija. Bajo la nueva estructura, Copilot Pro a $10/mes se convierte en 1.000 AI Credits, donde un crédito equivale a un centavo de dólar a tasa actual. Completaciones de código y sugerencias Next Edit siguen gratis; todo lo demás — Chat, corridas de agente, selección de modelo — se mide.
El cambio importa porque el modelo viejo era abusado en ambos extremos. Una tarea de agente autónomo de varias horas contaba como una Premium Request; una pregunta trivial contaba igual. El nuevo modelo ata el costo al volumen real de tokens — entrada, salida, cache hits, tipo de función — con tasas que varían según modelo. GitHub no ha publicado la tabla de tarifas por modelo, pero la implicación es directa: las corridas de agente clase Claude Sonnet cuestan más por crédito que las completaciones clase Haiku, y cualquier equipo que construyó workflows alrededor de la abstracción "Premium Request" ahora necesita modelar gasto en tokens en lugar de gasto en asientos. Fecha efectiva: 1 de junio de 2026.
Esta es la economía de wrappers alcanzando su propia infraestructura. Las herramientas dev de tarifa plana eran viables cuando los costos de API estaban fuertemente subsidiados por VC y cuando el stack de agente era delgado. Los modelos de razonamiento y las trazas de agente de larga ejecución rompieron esa matemática — un agente codificador haciendo rollouts de 100K tokens en un refactor complejo es genuinamente un perfil de costo distinto a una completación de 200 tokens. GitHub pasando los costos es precio honesto; también es una apertura competitiva para herramientas que ofrecen alternativas de tarifa plana o auto-hospedadas, porque cada shop dev con una línea Copilot acaba de tener una sorpresa presupuestaria.
Si entregas código con Copilot en tu stack, instrumenta antes del 1 de junio: registra volúmenes de Chat, agente y uso de herramientas para estimar gasto en tokens a las nuevas tasas. Si no logras una estimación limpia desde GitHub, fija un tope duro de créditos por desarrollador el primer mes y ajusta. Continue auto-hospedado con modelos de pesos abiertos es una alternativa creíble para shops con capacidad de operaciones. Para todos los demás, la respuesta es la misma que siempre cuando aparece un medidor por llamada: mide primero, optimiza los ciclos que mueven la factura.
