OpenAI在其Agents SDK中推出了沙箱执行功能,面向那些在部署自动化工作流时努力保持控制的企业团队。此次更新包括一个"模型原生工具",具有可配置内存、沙箱感知编排,以及文件系统工具,让开发者能够集成标准化原语,比如通过MCP使用工具和通过apply patch工具进行文件编辑。Oscar Health使用这一新基础设施自动化临床记录工作流,这是以前的方法无法可靠处理的,能够在复杂医疗文件中提取元数据并理解患者就诊边界。
这解决了我反复看到的一个真实痛点:团队在从原型转向生产时碰到架构壁垒,因为模型无关的框架无法充分利用前沿模型能力,而模型提供商的SDK缺乏对控制机制的可见性。OpenAI押注其模型与执行环境之间更紧密的集成将解决一直困扰敏感企业环境中agent部署的可靠性问题。
OpenAI公告中缺少的是这与现有agent治理解决方案的比较。LangSmith已经为agent应用提供可观察性和prompt管理,包括与OpenAI的SDK配合使用。这个时机感觉很有战略性——与DevDay的Apps in ChatGPT发布同时推出,这看起来更像是OpenAI在其生态系统周围建墙,而不是解决根本的agent治理问题。Microsoft的开源Agent Governance Toolkit和其他平台无关的解决方案表明,市场并不相信供应商锁定是答案。
对开发者来说,关键问题不是这是否有效——它可能确实有效。而是押注OpenAI基础设施是否值得在灵活性降低和供应商依赖方面做出权衡。如果你已经深度融入OpenAI生态系统并且现在就需要agent治理,这可能会起作用。但如果你在为长远构建,开源和平台无关的选项可能更好地为你服务。
