Ingenieros de Cloudflare revelaron que el tráfico de bots de IA ahora genera más de 10 mil millones de solicitudes por semana—aproximadamente un tercio de su tráfico total—con patrones que fundamentalmente rompen las suposiciones tradicionales de caché. A diferencia de la navegación humana, los crawlers de IA mantienen ratios de acceso a URL únicos del 70-100%, accediendo a páginas raramente visitadas y tipos de contenido diversos que no pueden aprovechar efectivamente el contenido en caché. Esto crea lo que los investigadores llaman "cache churn", donde el tráfico de IA desplaza el contenido humano frecuentemente solicitado de los caches edge.
La escala de este problema se extiende mucho más allá de los CDN. Amy Lee de Aerospike notó que el tráfico de IA rompe las arquitecturas de caché "hasta el nivel de base de datos", mientras que la ingeniera de sistemas Erika S reportó que "LRU fallando bajo carga de IA hace el hosting alemán impredecible". El problema surge de servicios de IA como la generación aumentada por recuperación creando bucles iterativos que consistentemente acceden a contenido único, violando los principios de localidad que hacen funcionar el caché.
Cloudflare y ETH Zurich proponen estrategias de caché conscientes de IA incluyendo niveles de caché separados para tráfico de bots, algoritmos adaptativos que consideran patrones de acceso de IA, y modelos de precios pay-per-crawl. Pero estas soluciones se sienten como curitas en un problema arquitectónico más profundo—toda nuestra infraestructura web fue diseñada alrededor de patrones de comportamiento humano predecibles que la IA fundamentalmente no sigue.
Para desarrolladores ejecutando aplicaciones de IA, esto significa que sus sistemas RAG y crawlers probablemente están creando cache miss costosos en cada capa de infraestructura que tocan. Consideren implementar deduplicación de solicitudes, estrategias de batching, y horarios de crawling coordinados. La trayectoria actual sugiere que necesitamos repensar las arquitecturas de caché por completo, no solo optimizar en los bordes.
