Amazon研究人员发布了A-Evolve,这是一个旨在通过直接变异AI Agent的代码和配置文件来自动化开发周期的框架。该系统引入了一个"Agent Workspace",包含五个组件——用于配置的manifest.yaml、用于推理逻辑的prompts、用于可重用函数的skills、用于外部API的tools,以及用于历史上下文的memory。一个"Mutation Engine"通过五阶段循环操作这些文件:解决任务、观察性能、通过修改workspace文件进化、通过fitness函数验证、重复。

这个时机反映了对当前agent开发工作流程日益增长的挫败感。任何构建生产agent的人都知道这种痛苦——agent在SWE-bench GitHub issues等任务上失败,迫使开发者陷入无穷无尽的日志检查、prompt重写和工具添加循环。A-Evolve将agent视为"可变artifacts的集合",通过环境反馈进化的方法解决了一个真正的瓶颈。与PyTorch的比较并非完全离题;就像PyTorch抽象掉了手动梯度计算一样,这可能抽象掉手动prompt工程。

然而,单一来源的报道引发了对现实世界验证的质疑。"零人工干预"和将"种子agent"转变为高性能表现者的说法听起来很有前景,但缺乏独立验证或详细基准测试。该框架的GitHub仓库存在,但没有更广泛的行业测试或竞争视角,不清楚这是解决了自动化问题,还是仅仅为已经在可靠性和可预测性方面苦苦挣扎的agent开发工作流程增加了另一层复杂性。