UK AISI: horizonte de tempo cyber de IA dobra a cada 4.7 meses; Mythos/GPT-5.5 saturam benchmark, Zubnet AI Notícias

O AI Security Institute (AISI) do governo do Reino Unido publicou na quinta-feira um acompanhamento atualizado de capacidades cyber com números que revisam a estimativa anterior de trajetória do campo. A AISI mede a capacidade cyber dos modelos frontier via "time horizon benchmarks" — quanto tempo um sistema de IA consegue completar tarefas de cibersegurança autonomamente comparado a experts humanos. A estimativa de fevereiro de 2026 coloca o horizonte de tempo cyber a 80% de confiabilidade dobrando a cada 4.7 meses desde que modelos de raciocínio emergiram no final de 2024, dado um limite de 2.5M tokens por tarefa. A estimativa de novembro de 2025 tinha sido de 8 meses para confiabilidades de 50% e 80% — então a taxa de duplicação aproximadamente caiu pela metade em três meses. Claude Mythos Preview e GPT-5.5 desde então superaram significativamente até a tendência revisada de 4.7 meses; a AISI sinaliza explicitamente a questão em aberto de se isso é "uma quebra isolada das taxas existentes de progresso ou parte de uma nova tendência mais rápida". O enquadramento honesto importa: a AISI não está declarando uma nova tendência, apenas documentando que os dados mais recentes são mais rápidos do que até a estimativa recentemente revisada.

Os resultados específicos de cyber-range são o que torna isso concreto. Claude Mythos Preview se tornou o primeiro modelo a completar os dois ranges avaliados pela AISI. "The Last Ones" — um ataque simulado de rede corporativa de 32 passos — foi resolvido 6 de 10 tentativas. "Cooling Tower" — um ataque de sistema de controle industrial de 7 passos, antes não resolvido por nenhum modelo testado — foi resolvido 3 de 10. GPT-5.5 completou "The Last Ones" 3 de 10 mas não resolveu Cooling Tower nas rodadas reportadas. Tanto Mythos quanto GPT-5.5 atingiram taxas de sucesso próximas de 100% nas tarefas mais longas da suite de teste cyber limitada mesmo com o teto de 2.5M tokens aplicado. O resultado do Cooling Tower ICS é o ponto de dado mais significativo operacionalmente — até essa rodada, o cenário de industrial-controls tinha resistido a cada modelo frontier testado, e a taxa de sucesso de 3/10 de um único modelo cruza um limiar de planejamento defensivo para qualquer organização rodando sistemas OT. O acompanhamento da AISI é consistente com o METR, o grupo de pesquisa nonprofit cuja métrica de capacidade de engenharia de software de IA tem dobrado aproximadamente a cada 4.2 meses desde o final de 2024.

O problema de saturação do benchmark é a parte a ponderar com mais cuidado. A AISI nota explicitamente: "os últimos modelos frontier estão começando a exceder os limites do framework atual de avaliação cyber... uma vez que modelos consistentemente completam as tarefas mais difíceis, o benchmark fica mais difícil de medir". Remover o teto de 2.5M tokens empurraria as taxas de sucesso alto o suficiente para que as estimativas de horizonte de tempo "não pudessem mais ser calculadas confiavelmente". Essa é a honestidade de disclosure de harness que o CLAUDE.md valoriza — o benchmark está se aproximando do regime onde não diferencia mais entre modelos, e a AISI está dizendo isso. O corolário é que a próxima rodada de afirmações de capacidade dos labs frontier vai precisar de novas evals ou arriscará ser sem sentido; espere ver Mythos Preview e GPT-5.5 citados como "100% na suite cyber da AISI" enquanto a diferenciação subjacente é invisível. Pareie isso com a pesquisa VectorSmuggle de ontem (classe de ataque inédita sobre infraestrutura RAG) e Microsoft MDASH da semana passada (100+ agentes encontrando RCEs do Windows): a capacidade ofensiva está se compondo através de múltiplos frames de medição simultaneamente.

Para builders e times de segurança defensiva: assuma que a trajetória de duplicação de 4.7 meses se mantém pelo menos até o Q3 2026, e trate a sobreperformance Mythos/GPT-5.5 como folga adicional. Implicações concretas de planejamento: (1) o horizonte de tempo que um único modelo frontier consegue sustentar autonomamente para operações de intrusão multi-passo agora se mede em dezenas-de-passos, não exploits one-shot — o monitoramento defensivo construído em torno de detecção point-in-time vai continuar perdendo terreno; (2) o limiar de sistemas-de-controle-industriais (Cooling Tower) sendo cruzado por um modelo significa que o mesmo limiar será cruzado por outros em 3-6 meses na trajetória atual — times de segurança OT/ICS deveriam estar rodando suas próprias evals estilo cyber-range AISI contra os modelos que esperam enfrentar; (3) a própria metodologia cyber-range da AISI é a parte para levantar — "o modelo resolveu um cenário de ataque corporativo de 32 passos?" é uma eval mais útil que scores agregados de CTF para modelagem de risco. Acompanhe a próxima atualização trimestral da AISI; se a duplicação de 4.7 meses se mantém, o horizonte de tempo cyber no final do ano é aproximadamente 4× o que é agora.

UK AISI: horizonte de tempo cyber de IA dobra a cada 4.7 meses; Mythos/GPT-5.5 saturam benchmark

Mais notícias