智能體：定義與含義 — AI 維基

一個能夠自主規劃並執行多步驟任務的人工智慧系統，使用工具（網頁搜尋、程式碼執行、API 呼叫）來達成目標。與只能一次回答一個問題的簡單聊天機器人不同，代理會根據迄今所學來決定下一步該做什麼。

為什麼重要

Agents 是連結「會說話的 AI」與「會做事的 AI」的橋樑。當你的 AI 能夠自行瀏覽文件、撰寫程式碼並進行測試，而無需你在每一步都親自指導 — 這就是 Agent。

深度解析

從本質上來說，代理程式只不過是一個迴圈。模型接收一個目標，決定下一步的動作（通常是調用工具），觀察結果，並重複這個過程，直到目標達成或決定無法繼續。這種模式有時被稱為「ReAct」模式 — Reason（推理）、Act（行動）、Observe（觀察）。讓它強大的原因是模型在迭代過程中能維持狀態：它會記得已經嘗試過什麼、什麼失敗了，以及收集到哪些資訊。這個迴圈由一個控制程式碼來協調 — 這段程式碼會向模型發送訊息、執行模型請求的工具調用，並把結果反饋回去。LangChain、CrewAI 和 Anthropic 自己的 Agent SDK 等框架提供了這個控制程式碼，但你也可以用約五十行程式碼自行建立一個。模型本身從來不會「執行」任何東西；它只會輸出結構化的 JSON，說明「用這些參數呼叫這個函數」，而你的程式碼會處理其餘部分。

設計工具箱

一個優秀的代理程式與令人沮喪的代理程式之間的實際差異，取決於你如何定義它的工具以及給予它多少自主權。像 Claude Code 或 Cursor 的代理模式這樣的程式設計代理程式，可能擁有讀取文件、寫入文件、執行 shell 命令和搜尋程式碼庫的工具。一個客服代理程式可能擁有查詢訂單、發放退款和升級票務的工具。關鍵的設計決定是細度：工具太少，代理程式就無法完成任何有用的任務；工具太多，它會對該選擇哪個感到困惑。在實際生產環境中，大多數團隊發現 5–15 個明確定義的工具是最佳選擇。每個工具都需要一個清晰的名稱、良好的描述（這是模型用來決定何時使用它的依據），以及良好的參數類型定義。

一個代理程式勝過一群

關於代理程式最大的誤解之一是，它需要複雜的多代理架構才能發揮作用。產業曾經經歷過「代理程式群」和「團隊」模式的階段，當時會有規劃代理程式、研究代理程式、寫作代理程式和評論代理程式彼此交談。實際上，一個模型在緊密迴圈中搭配良好的工具，通常會比這些複雜的設定表現更好。多代理模式會增加延遲、成本和失敗的可能性。它們只在真正平行的工作負載中才有意義 — 例如同時掃描十個倉庫 — 但對於大多數順序任務，一個擁有明確指示的代理程式就能完成任務。目前推出實際代理產品的公司（Anthropic、OpenAI、Google）都已收斂於這種更簡單的架構。

可靠性問題

可靠性才是困難的部分。一個 90% 時間都能運作的代理程式聽起來不錯，但當你意識到在一個 10 步的任務中，每步 90% 的成功率會讓你有約 35% 的機會完成全部任務時，這就不再那麼吸引人了。這就是為什麼生產環境中的代理程式需要防護措施：設定最大迭代次數限制、成本上限、針對危險動作（例如刪除資料或花費金錢）的人機協作檢查點，以及優雅的失敗機制。最好的代理程式實現還會包含帶有退避機制的重試邏輯、結構化的錯誤處理（將失敗回饋給模型，使其嘗試不同方法），以及讓你能精確追蹤問題發生時情況的日誌。

從示範到生產

代理程式的演進速度非常快。2023 年，AutoGPT 爆紅，但基本上只是一個示範 — 它會消耗大量 token，且很少能完成複雜任務。到了 2025 年，Claude Code、Devin 和類似工具已經能穩定地撰寫生產程式碼、執行測試並提交拉取請求。差異不僅在於更好的模型，還在於更好的工具設計、更好的提示工程，以及透過嚴謹工程實踐所獲得的教訓，即保持迴圈緊密。如果你今天正在開發代理程式，請從一個單一迴圈、幾個工具開始，並投入時間確保這些工具能回傳乾淨且有用的輸出。這比任何框架的選擇都更重要。

智能體