研究人員發布了OSGym,這是一個基礎設施框架,旨在解決訓練電腦使用AI代理程式的殘酷經濟問題。該系統每天僅需0.23美元就能管理超過1000個作業系統副本,解決了創建者所稱的「管線問題」,這個問題一直在阻礙代理程式研究的進展。與模型訓練或資料收集不同,構建能夠真正在實際作業系統中導航的代理程式需要啟動大量完整的OS環境——這項任務通常會讓研究人員花費數萬美元。
這個基礎設施瓶頸已經成為代理程式開發中的隱性約束。雖然像Anthropic這樣的公司用Claude展示了令人印象深刻的電腦使用演示,但現實是大規模訓練這些系統需要大多數研究人員根本無法負擔的基礎設施。OSGym試圖通過讓底層計算基礎設施變得更便宜、更易獲得來民主化這種能力。該框架專門針對概念驗證代理程式演示和能夠處理真實世界電腦任務的生產就緒系統之間的差距。
然而,OSGym發布的有限報導表明這仍然是早期階段的研究工具,而不是經過實戰檢驗的基礎設施。每天0.23美元這個數字雖然令人印象深刻,但缺乏關於這實際代表什麼計算資源以及是否能超越學術用例進行擴展的背景資訊。沒有主要的雲端提供商或AI公司驗證過這些聲明,該框架在生產工作負載下的實際效能仍未經測試。
對於構建電腦使用代理程式的開發者來說,如果OSGym能兌現其成本承諾,可能會顯著降低入門門檻。但更大的問題是,僅僅便宜的OS副本是否能解決仍然困擾這個領域的代理程式可靠性和安全性的根本挑戰。
