英國政府的 AI Security Institute(AISI)週四發布了更新的網路能力追蹤,數字修正了此前對該領域軌跡的估算。AISI 用「time horizon benchmarks」來衡量前沿模型的網路能力——也就是一個 AI 系統在自主完成網路安全任務時,能維持多長時間相對人類專家的對位水平。2026 年 2 月的估算:在 2.5M token 上限的前提下,自 2024 年底推理模型出現以來,80% 可靠度的網路 time horizon 大約每 4.7 個月翻一倍。2025 年 11 月的估算曾是 50% 和 80% 可靠度都是 8 個月——所以翻倍速度在三個月裡大約縮短了一半。Claude Mythos Preview 和 GPT-5.5 之後甚至超過了這個修訂後的 4.7 個月趨勢;AISI 明確標出了未解決的問題——「這是相對現有進步速率的孤立斷點,還是一個更快新趨勢的一部分」。誠實的措辭很關鍵:AISI 沒有宣布新趨勢,只是記錄了最新資料比剛修訂過的估算還要快。

具體的 cyber-range 結果是把這件事具體化的部分。Claude Mythos Preview 成為首個完成 AISI 兩個評測 range 的模型。「The Last Ones」——一個 32 步的模擬企業網路攻擊——10 次嘗試解出 6 次。「Cooling Tower」——一個 7 步的工業控制系統攻擊,此前沒有任何被測前沿模型解開過——10 次嘗試解出 3 次。GPT-5.5 把「The Last Ones」在 10 次裡解出 3 次,但在報告的 run 裡沒解開 Cooling Tower。即使加上 2.5M token 的上限,Mythos 與 GPT-5.5 在這套有限的 cyber 測試裡,在最長的任務上也幾乎都達到了 100% 成功率。Cooling Tower ICS 這一項是操作上意義最大的資料點——在這一輪之前,工業控制場景頂住了所有被測前沿模型;一個模型 3/10 的成功率,就足以跨過任何運行 OT 系統的組織在防禦規劃上的門檻。AISI 的追蹤和 METR 一致——這家非營利研究機構追蹤的 AI 軟體工程能力指標,自 2024 年底起大約每 4.2 個月翻一倍。

最值得仔細權衡的是 benchmark 飽和問題。AISI 明確寫:「最新的前沿模型正在開始超過當前網路評測框架的極限……一旦模型持續完成最難的任務,benchmark 就更難繼續測量了。」如果把 2.5M token 上限撤掉,成功率會高到讓 time horizon 估算「不再能可靠計算」。這就是 CLAUDE.md 重視的 harness 揭露誠實——benchmark 正接近無法在模型之間區分的狀態,AISI 自己講出來了。推論是:前沿實驗室下一輪的能力聲明,要麼需要新的 eval,要麼有變得毫無意義的風險;預期會看到 Mythos Preview 和 GPT-5.5 被引用為「在 AISI 網路套件上 100%」,而底層差異卻看不見。把這個跟昨天的 VectorSmuggle 研究(RAG 基礎設施上的新攻擊類)、上週的微軟 MDASH(100+ agent 找出 Windows RCE)放一起看:進攻側能力正在多個測量框架上同時複利。

對 builder 和防禦側安全團隊:假設這條 4.7 個月翻倍軌跡至少能撐到 2026 年 Q3,把 Mythos/GPT-5.5 的超額表現當作額外餘量。具體規劃上:(1) 單一前沿模型能自主撐下來的多步入侵操作的時間跨度,現在以「幾十步」為單位、不是 one-shot exploit——圍繞 point-in-time 偵測搭起來的防禦監控會繼續被推退;(2) 工業控制系統門檻(Cooling Tower)被一個模型跨過,意味著在當前軌跡上,這個門檻會被其它模型在 3-6 個月內跨過——OT/ICS 安全團隊應該用 AISI 風格的 cyber-range eval,在內部對他們預期會面對的模型自己跑一遍;(3) AISI 的 cyber-range 方法論本身值得借走——「模型能不能解一個 32 步的企業攻擊場景」作為 eval,比 CTF 總分聚合更能用於風險建模。盯著 AISI 下一次季度更新;如果 4.7 個月翻倍能保持,到年底,網路 time horizon 大約會是現在的 4 倍。