UK AISI: horizonte de tiempo cyber de IA dobla cada 4.7 meses; Mythos/GPT-5.5 saturan el benchmark, Zubnet AI Noticias

El AI Security Institute (AISI) del gobierno del Reino Unido publicó el jueves un seguimiento actualizado de capacidades cyber con números que revisan la estimación previa de trayectoria del campo. AISI mide la capacidad cyber de los modelos frontera vía "time horizon benchmarks" — cuánto tiempo un sistema de IA puede completar tareas de ciberseguridad de manera autónoma comparado con expertos humanos. La estimación de febrero 2026 pone el horizonte de tiempo cyber al 80% de confiabilidad doblando cada 4.7 meses desde que emergieron los modelos de razonamiento a fines de 2024, dado un límite de 2.5M tokens por tarea. La estimación de noviembre 2025 había sido 8 meses para confiabilidades del 50% y 80% — así que la tasa de doblaje se redujo aproximadamente a la mitad en tres meses. Claude Mythos Preview y GPT-5.5 desde entonces han superado significativamente incluso la tendencia revisada de 4.7 meses; AISI flaggea explícitamente la pregunta abierta de si esto es "un quiebre aislado de los ritmos existentes de progreso o parte de una nueva tendencia más rápida". El encuadre honesto importa: AISI no está declarando una nueva tendencia, solo documentando que los datos más recientes son más rápidos que incluso la estimación recientemente revisada.

Los resultados específicos de cyber-range son lo que hace esto concreto. Claude Mythos Preview se convirtió en el primer modelo en completar los dos rangos evaluados por AISI. "The Last Ones" — un ataque simulado de red corporativa de 32 pasos — fue resuelto 6 de 10 intentos. "Cooling Tower" — un ataque de sistema de control industrial de 7 pasos, previamente no resuelto por ningún modelo probado — fue resuelto 3 de 10. GPT-5.5 completó "The Last Ones" 3 de 10 pero no resolvió Cooling Tower en las corridas reportadas. Tanto Mythos como GPT-5.5 alcanzaron tasas de éxito cercanas al 100% en las tareas más largas de la suite de test cyber limitada incluso con el tope de 2.5M tokens aplicado. El resultado de Cooling Tower ICS es el punto de dato más significativo operacionalmente — hasta esta ronda, el escenario de industrial-controls había resistido a cada modelo frontera probado, y la tasa de éxito de 3/10 de un solo modelo cruza un umbral de planeación defensiva para cualquier organización corriendo sistemas OT. El seguimiento de AISI es consistente con METR, el grupo de investigación nonprofit cuya métrica de capacidad de ingeniería de software de IA ha doblado aproximadamente cada 4.2 meses desde fines de 2024.

El problema de saturación del benchmark es la parte a ponderar con más cuidado. AISI nota explícitamente: "los últimos modelos frontera están comenzando a exceder los límites del marco actual de evaluación cyber... una vez que los modelos consistentemente completan las tareas más difíciles, el benchmark se vuelve más difícil de medir". Remover el tope de 2.5M tokens empujaría las tasas de éxito lo suficientemente alto como para que las estimaciones de horizonte de tiempo "ya no pudieran ser calculadas confiablemente". Esta es la honestidad de divulgación de arnés que CLAUDE.md valora — el benchmark está acercándose al régimen donde ya no diferencia entre modelos, y AISI lo está diciendo. El corolario es que la siguiente ronda de reclamos de capacidad de los labs frontera necesitará nuevas evaluaciones o se arriesga a no significar nada; espera ver a Mythos Preview y GPT-5.5 citados como "100% en la suite cyber de AISI" mientras la diferenciación subyacente es invisible. Empareja esto con la investigación VectorSmuggle de ayer (clase de ataque novedosa sobre infraestructura RAG) y Microsoft MDASH de la semana pasada (100+ agentes encontrando RCEs de Windows): la capacidad ofensiva se está componiendo a través de múltiples marcos de medición simultáneamente.

Para builders y equipos de seguridad defensiva: asume que la trayectoria de doblaje de 4.7 meses se mantiene al menos hasta el Q3 2026, y trata la sobreperformance Mythos/GPT-5.5 como margen adicional. Implicaciones concretas de planeación: (1) el horizonte de tiempo que un solo modelo frontera puede sostener autónomamente para operaciones de intrusión multi-paso se mide ahora en docenas-de-pasos, no exploits one-shot — el monitoreo defensivo construido alrededor de detección point-in-time va a seguir perdiendo terreno; (2) el umbral de sistemas-de-control-industriales (Cooling Tower) siendo cruzado por un modelo significa que el mismo umbral será cruzado por otros en 3-6 meses en la trayectoria actual — los equipos de seguridad OT/ICS deberían estar corriendo sus propias evals estilo cyber-range AISI contra los modelos que esperan enfrentar; (3) la metodología cyber-range de AISI en sí es la parte a levantar — "¿resolvió el modelo un escenario de ataque corporativo de 32 pasos?" es una evaluación más útil que los puntajes agregados de CTF para modelado de riesgo. Vigila la próxima actualización trimestral de AISI; si el doblaje de 4.7 meses se mantiene, el horizonte de tiempo cyber a fin de año es aproximadamente 4× lo que es ahora.

UK AISI: horizonte de tiempo cyber de IA dobla cada 4.7 meses; Mythos/GPT-5.5 saturan el benchmark

Más noticias