丹麦初创公司Leapwork推出了其Continuous Validation Platform,部署AI代理来自动验证代码,因为生成式AI工具使开发加速。该公司认为"AI vibe coding"已将软件开发推向"极速",需要自动化测试来匹配AI生成代码部署的步伐。

这触及了我一直在跟踪的真实痛点。正如我上个月写到A-Evolve自动化承诺时所说,根本挑战不是速度——而是可靠性。当Claude代理并行运行时,正如我在四月报道的,协调失败成倍增加。Leapwork将验证完全交给AI代理的方法是在行业学到人类监督对生产系统仍然至关重要时加倍下注自动化。

有限的报道揭示了令人担忧的缺口。没有关于这些验证代理实际如何工作、运行什么类型测试或如何处理边缘情况的技术细节。更重要的是,没有讨论失败模式或人类监督机制。根据我集成63个AI提供商的经验,我知道完全自动化验证听起来很有吸引力,直到你的AI代理因为看起来"合理"而批准了有bug的代码。

开发者应该对任何承诺完全消除人类验证的平台保持怀疑。真正价值不是从循环中移除人类——而是用AI速度增强人类判断。如果你在评估自动化测试工具,要求错误处理、人类覆盖能力以及AI出错时会发生什么的具体信息。因为它一定会出错。