IBM 於 4 月 28 日宣布 Bob 正式上市,這是一款面向背負技術債、混合雲與合規要求的企業開發平台。Bob 覆蓋完整 SDLC —— 探索、規劃、撰碼、測試、部署、維運 —— 並使用基於角色的 agent,透過受治理的工作流加以協調。該發布與 GitHub 宣布 Copilot 按用量計費同週到來,定調相似:面向企業的 AI 開發工具必須控制成本與風險,而不只是加快敲鍵盤。IBM 表示自有 8 萬員工已在使用 Bob,平均生產力提升 45% —— 在獲獨立驗證之前,這個數字應歸入「廠商自陳」一檔。

底層來看,Bob 是一個模型路由平台。它混合前沿 LLM(未具名)、開源模型、IBM 自家的 Granite SLM 以及針對特定任務的微調模型,依任務根據準確率、延遲與成本進行選擇。其 agentic 部分,是在測試、文件與 CI/CD 流程之間做多 agent 協調,邊界處加以 human-in-the-loop 控制。最具差異化、也是其他多數 AI 開發工具默默迴避的能力,是大型主機現代化。IBM 引用克羅埃西亞政府 IT 營運商 APIS IT 的案例,遷移 .NET 服務與 JCL/PL/I 舊系統,聲稱架構文件交付速度提高 10 倍,且「在 JCL/PL/I 舊系統上達到 100% 準確率」。後一種說法只有在能看到測試語料的前提下才有意義;孤立來看,就是行銷話術。

IBM 來過這裡。Watson AIOps、Watson Code Assistant for Z、最早的 Watson Discovery —— IBM 多次發布過面向企業的 AI 開發工具,客戶成果軌跡一向參差。Bob 之所以值得關注,在於其架構的確現代 —— 多 agent 加 SLM 與前沿 LLM 之間的模型路由,而非只是一個大模型套上一層殼 —— 並且大型主機支援是一道真實護城河。Cursor、Claude Code 與 Copilot 都不自帶 PL/I 專長。但 IBM 提到的失敗模式都是真的:在無文件舊環境中的幻覺、各自為政的 RAG 資料孤島、模型給出語法正確但功能無用的程式碼。Bob 究竟解決了這些問題,還是用多 agent 編排粉飾過去 —— 這是懸而未決的問題,IBM 的發布材料並不作答。

對於不在企業 SDLC 一線的 builders 而言,Bob 主要是一個市場訊號:IBM 認為下一輪企業 AI 開發工具競爭將圍繞治理、模型路由與遺留系統整合展開,而不是聊天速度。對於身處帶有大型主機債務的企業內部的 builders,這是少數幾個明確瞄準你問題的選擇;聰明做法是在一個受控的遺留模組上試點,並對照你自己的程式碼庫測量真實的幻覺率,而不是相信 100% 準確率的標題。30 天試用就是為此準備的槓桿。對所有關注此領域的人而言:留意 IBM 的模型路由模式 —— 用小型 Granite 處理量大但便宜的任務、用前沿 LLM 處理難任務,這種架構是任何成本敏感的企業都會想複製的,無論用不用 IBM。