Amazon研究人員發佈了A-Evolve,這是一個旨在透過直接變異AI Agent的程式碼和配置檔案來自動化開發週期的框架。該系統引入了一個「Agent Workspace」,包含五個元件——用於配置的manifest.yaml、用於推理邏輯的prompts、用於可重複使用函數的skills、用於外部API的tools,以及用於歷史上下文的memory。一個「Mutation Engine」透過五階段循環操作這些檔案:解決任務、觀察效能、透過修改workspace檔案進化、透過fitness函數驗證、重複。
這個時機反映了對當前agent開發工作流程日益增長的挫敗感。任何構建生產agent的人都知道這種痛苦——agent在SWE-bench GitHub issues等任務上失敗,迫使開發者陷入無窮無盡的日誌檢查、prompt重寫和工具新增循環。A-Evolve將agent視為「可變artifacts的集合」,透過環境回饋進化的方法解決了一個真正的瓶頸。與PyTorch的比較並非完全離題;就像PyTorch抽象掉了手動梯度計算一樣,這可能抽象掉手動prompt工程。
然而,單一來源的報導引發了對現實世界驗證的質疑。「零人工干預」和將「種子agent」轉變為高效能表現者的說法聽起來很有前景,但缺乏獨立驗證或詳細基準測試。該框架的GitHub儲存庫存在,但沒有更廣泛的行業測試或競爭觀點,不清楚這是解決了自動化問題,還是僅僅為已經在可靠性和可預測性方面苦苦掙扎的agent開發工作流程增加了另一層複雜性。
