Grab 給自己的 Analytics Data Warehouse 平台上了一套生產級的多 agent 工程支援系統,部署給 1,000+ 管理 15,000+ 張表的內部使用者。架構:一個 supervisor agent 負責通訊和任務分派;幾個專長 agent 各管context 檢索、程式碼搜尋、方案生成。兩條主工作流 —— 調查(查詢分析、SQL 除錯、log 檢索、schema 查找)和優化(程式碼修復、自動 merge request)。工作流引擎走 LangGraph,FastAPI 服務負責路由、工具執行、狀態管理。工具生態從 30+ 個工具收斂到一套精選:受控 SQL 執行、metadata 存取、log 檢索、基於 Git 的工作流。具體用了哪些模型沒披露。回報的影響:Head of Analytics 說「每個月省下幾百小時工程時間」,而且團隊從「被動救火」轉向「平台開發工作」。
架構選擇才是真正值得研究的地方。第一,**收緊 agent 的職責** —— 每個專長 agent 範圍都被卡得很窄,降低推理上的歧義。這跟今早那篇 agent 安全裡的「proposal-execution 拆分」是同一種本能:把 agent 能決定的事限制住,讓 gate 能驗證它真正做的事。第二,**所有程式碼改動都過 human-in-the-loop** —— 沒有 agent 不經 review 就往生產裡寫。第三,**SQL 執行驗證層加敏感資料保護** —— agent 不直接跑任意 SQL,它跑的 SQL 是過一道受控執行 gate,gate 先 scrub 敏感資料、先 validate,再放行。第四,**為了多步推論在 token 限制內,做結構化的 context 壓縮** —— 長上下文這個問題(15K 張表意味著 schema 查找會很快把 context 預算吃光)是用顯式壓縮解決的,不是靠模型自己「想清楚什麼有用」。30-工具-收斂-到-精選 這個動作本身就是營運層面的教訓:tool sprawl 讓 agent 不是更能幹,而是更不靠譜。把工具集做精,本身就是工作。
對 builder 為什麼重要。這種規模(1K 使用者、15K 表)、這種具體度(明確說出 LangGraph + FastAPI 棧、明確說出 human-in-the-loop、明確說出工具收斂)的生產級多 agent 部署,在公開 reporting 裡其實是稀缺品。大多數公開的 agent 案例都還是 demo 或者 pilot。Grab 的具體細節告訴你「生產級現在長什麼樣」:framework 選型(LangGraph 而不是 AutoGen / CrewAI / 自研)是真實訊號 —— LangGraph 的 checkpointing 和 supervisor-pattern 原語在這種 use case 上是 battle-tested 的。Analytics Data Warehouse 這個 use case 也很可推廣:任何地方,你有一個複雜的內部平台(資料倉儲、內部 API 面、infra 自動化)在支撐很多工程師,而支援工作大量是重複勞動,Grab 這個 pattern 都適用 —— supervisor agent、專長 retriever、受控執行 gate、對所有寫操作 human-in-loop。
週一上手:如果你在考慮搭一套多 agent 的工程支援系統,Grab 這個 pattern 是一個 strong template。具體起點。(1) 如果你的團隊對 orchestration 層還沒有強意見,先選 LangGraph —— supervisor-pattern 原語跟 investigation / enhancement 這種工作流拆分是 cleanly map 上的。(2) 審一下你現有的內部工具面;Grab 那個 30-收斂-到-精選 就是教訓 —— 工具太多會讓 agent 變差。從「能覆蓋 80% 支援負載的 5 到 10 個工具」這個名單起步,然後再加。(3) 在讓 agent 寫任何東西到生產之前,把受控執行 gate 先搭起來。SQL 執行驗證 + 敏感資料 scrub 是 Grab 用的具體 pattern;更一般的 pattern 是「policy 校驗過的、不可繞開的執行」。(4) 所有程式碼改動的 human-in-the-loop,從第一天就規劃進去 —— 後面再加比從一開始就建,要難得多。(5) 把「省下的工程小時數」當主指標,而不是「ticket 關閉數」或者模型準確率 —— agent 的 business case 就是 reclaim 工程時間,Grab 的 Head of Analytics 引用的也正是這個。Eval 指標要和 business 指標對齊。
