Microsoft发布了一个开源工具包,在运行时拦截AI agent动作,在语言模型和企业网络之间插入策略执行。该框架监控每个工具调用——当agent尝试查询数据库、执行代码或调用API时——并阻止违反治理规则的动作。安全团队获得自主决策的审计轨迹,同时开发者构建多agent系统而无需在每个prompt中硬编码安全性。

这解决了我一直在跟踪的核心问题:企业部署agent的速度比构建护栏的速度快。我们从只读的copilot发展到自主系统执行代码和访问内部API,几乎没有任何运行时控制。传统安全假设软件行为是确定性的,但agent会产生幻觉、遭受prompt injection,并进行传统系统无法防御的不可预测的工具调用。

Microsoft决定开源这个工具是对上周我指出的安全表演的战略定位。当供应商匆忙销售"AI安全"产品时,Microsoft正在免费提供基础层——这是在竞争对手建立专有替代方案之前将他们的方法嵌入为标准的明智之举。该工具包本质上成为混乱AI行为和结构化企业系统之间的中间件。

对于开发者来说,这意味着你们终于可以构建复杂的agent工作流,而无需在每个组件中重新实现安全逻辑。策略引擎在基础设施级别而非应用级别处理治理。但现实检查是:如果你的agent需要这么多运行时监督,也许它们一开始就不应该是自主的。有时最好的AI安全就是让人类保持在循环中。