OpenAI在其Agents SDK中推出了沙箱執行功能,針對那些在部署自動化工作流程時努力保持控制的企業團隊。此次更新包括一個「模型原生工具」,具有可配置記憶體、沙箱感知編排,以及檔案系統工具,讓開發者能夠整合標準化原語,比如透過MCP使用工具和透過apply patch工具進行檔案編輯。Oscar Health使用這一新基礎設施自動化臨床記錄工作流程,這是以前的方法無法可靠處理的,能夠在複雜醫療檔案中提取metadata並理解病患就診邊界。

這解決了我反覆看到的一個真實痛點:團隊在從原型轉向生產時碰到架構壁壘,因為模型無關的framework無法充分利用前沿模型能力,而模型提供商的SDK缺乏對控制機制的可見性。OpenAI押注其模型與執行環境之間更緊密的整合將解決一直困擾敏感企業環境中agent部署的可靠性問題。

OpenAI公告中缺少的是這與現有agent治理解決方案的比較。LangSmith已經為agent應用程式提供可觀察性和prompt管理,包括與OpenAI的SDK配合使用。這個時機感覺很有戰略性——與DevDay的Apps in ChatGPT發布同時推出,這看起來更像是OpenAI在其生態系統周圍建牆,而不是解決根本的agent治理問題。Microsoft的開源Agent Governance Toolkit和其他平台無關的解決方案表明,市場並不相信vendor lock-in是答案。

對開發者來說,關鍵問題不是這是否有效——它可能確實有效。而是押注OpenAI基礎設施是否值得在彈性降低和供應商依賴方面做出權衡。如果你已經深度融入OpenAI生態系統並且現在就需要agent治理,這可能會起作用。但如果你在為長遠建構,開源和平台無關的選項可能更好地為你服務。