一個能夠自主規劃並執行多步驟任務的人工智慧系統,使用工具(網頁搜尋、程式碼執行、API 呼叫)來達成目標。與只能一次回答一個問題的簡單聊天機器人不同,代理會根據迄今所學來決定下一步該做什麼。
Agents 是連結「會說話的 AI」與「會做事的 AI」的橋樑。當你的 AI 能夠自行瀏覽文件、撰寫程式碼並進行測試,而無需你在每一步都親自指導 — 這就是 Agent。
從本質上來說,代理程式只不過是一個迴圈。模型接收一個目標,決定下一步的動作(通常是調用工具),觀察結果,並重複這個過程,直到目標達成或決定無法繼續。這種模式有時被稱為「ReAct」模式 — Reason(推理)、Act(行動)、Observe(觀察)。讓它強大的原因是模型在迭代過程中能維持狀態:它會記得已經嘗試過什麼、什麼失敗了,以及收集到哪些資訊。這個迴圈由一個控制程式碼來協調 — 這段程式碼會向模型發送訊息、執行模型請求的工具調用,並把結果反饋回去。LangChain、CrewAI 和 Anthropic 自己的 Agent SDK 等框架提供了這個控制程式碼,但你也可以用約五十行程式碼自行建立一個。模型本身從來不會「執行」任何東西;它只會輸出結構化的 JSON,說明「用這些參數呼叫這個函數」,而你的程式碼會處理其餘部分。
一個優秀的代理程式與令人沮喪的代理程式之間的實際差異,取決於你如何定義它的工具以及給予它多少自主權。像 Claude Code 或 Cursor 的代理模式這樣的程式設計代理程式,可能擁有讀取文件、寫入文件、執行 shell 命令和搜尋程式碼庫的工具。一個客服代理程式可能擁有查詢訂單、發放退款和升級票務的工具。關鍵的設計決定是細度:工具太少,代理程式就無法完成任何有用的任務;工具太多,它會對該選擇哪個感到困惑。在實際生產環境中,大多數團隊發現 5–15 個明確定義的工具是最佳選擇。每個工具都需要一個清晰的名稱、良好的描述(這是模型用來決定何時使用它的依據),以及良好的參數類型定義。
關於代理程式最大的誤解之一是,它需要複雜的多代理架構才能發揮作用。產業曾經經歷過「代理程式群」和「團隊」模式的階段,當時會有規劃代理程式、研究代理程式、寫作代理程式和評論代理程式彼此交談。實際上,一個模型在緊密迴圈中搭配良好的工具,通常會比這些複雜的設定表現更好。多代理模式會增加延遲、成本和失敗的可能性。它們只在真正平行的工作負載中才有意義 — 例如同時掃描十個倉庫 — 但對於大多數順序任務,一個擁有明確指示的代理程式就能完成任務。目前推出實際代理產品的公司(Anthropic、OpenAI、Google)都已收斂於這種更簡單的架構。
可靠性才是困難的部分。一個 90% 時間都能運作的代理程式聽起來不錯,但當你意識到在一個 10 步的任務中,每步 90% 的成功率會讓你有約 35% 的機會完成全部任務時,這就不再那麼吸引人了。這就是為什麼生產環境中的代理程式需要防護措施:設定最大迭代次數限制、成本上限、針對危險動作(例如刪除資料或花費金錢)的人機協作檢查點,以及優雅的失敗機制。最好的代理程式實現還會包含帶有退避機制的重試邏輯、結構化的錯誤處理(將失敗回饋給模型,使其嘗試不同方法),以及讓你能精確追蹤問題發生時情況的日誌。
代理程式的演進速度非常快。2023 年,AutoGPT 爆紅,但基本上只是一個示範 — 它會消耗大量 token,且很少能完成複雜任務。到了 2025 年,Claude Code、Devin 和類似工具已經能穩定地撰寫生產程式碼、執行測試並提交拉取請求。差異不僅在於更好的模型,還在於更好的工具設計、更好的提示工程,以及透過嚴謹工程實踐所獲得的教訓,即保持迴圈緊密。如果你今天正在開發代理程式,請從一個單一迴圈、幾個工具開始,並投入時間確保這些工具能回傳乾淨且有用的輸出。這比任何框架的選擇都更重要。