丹麥新創公司Leapwork推出了其Continuous Validation Platform,部署AI代理來自動驗證程式碼,因為生成式AI工具使開發加速。該公司認為「AI vibe coding」已將軟體開發推向「極速」,需要自動化測試來匹配AI生成程式碼部署的步調。
這觸及了我一直在追蹤的真實痛點。正如我上個月寫到A-Evolve自動化承諾時所說,根本挑戰不是速度——而是可靠性。當Claude代理並行運行時,正如我在四月報導的,協調失敗成倍增加。Leapwork將驗證完全交給AI代理的方法是在產業學到人類監督對生產系統仍然至關重要時加倍下注自動化。
有限的報導揭示了令人擔憂的缺口。沒有關於這些驗證代理實際如何工作、執行什麼類型測試或如何處理邊緣情況的技術細節。更重要的是,沒有討論失敗模式或人類監督機制。根據我整合63個AI提供商的經驗,我知道完全自動化驗證聽起來很有吸引力,直到你的AI代理因為看起來「合理」而批准了有bug的程式碼。
開發者應該對任何承諾完全消除人類驗證的平台保持懷疑。真正價值不是從循環中移除人類——而是用AI速度增強人類判斷。如果你在評估自動化測試工具,要求錯誤處理、人類覆蓋能力以及AI出錯時會發生什麼的具體資訊。因為它一定會出錯。
