自主代理：定義與含義 — AI 維基

一種能夠在最少人類監督下獨立規劃、決策和執行多步驟任務的 AI 系統。給定一個高層級目標（「研究競爭對手並撰寫報告」），自主代理將其分解為步驟，使用工具（網路搜尋、程式碼執行、檔案管理），處理錯誤，並交付結果。自主程度從「每一步都請求許可」到「直接執行並回報結果」不等。

為什麼重要

自主代理是超越聊天機器人和副駕駛的下一步演進。聊天機器人回答問題。副駕駛協助完成任務。代理獨立完成任務。經濟潛力巨大——能夠以極低的成本和時間處理例行知識工作（研究、資料分析、客服、程式碼審查）的代理。但可靠性和安全性的挑戰仍然重大。

深度解析

代理迴路：(1) 觀察當前狀態（已完成什麼、有什麼資訊可用），(2) 規劃下一步行動（使用 LLM 的推理），(3) 執行行動（工具呼叫、程式碼執行、API 請求），(4) 觀察結果，(5) 決定是繼續、調整還是完成。這個觀察-規劃-行動迴路重複直到任務完成或代理卡住並尋求幫助。

可靠性是瓶頸

根本性的挑戰：代理工作流程中的每一步都有一定的錯誤機率（選錯工具、推理不正確、誤解結果）。在 10 步工作流程中，即使每步 95% 的準確率也只會累積到整體 60% 的成功率。這就是為什麼目前的代理在對個別步驟錯誤有一定容忍度的任務（研究、腦力激盪）上表現最好，而在需要每一步都精確的任務（金融交易、法律文件）上掙扎。

人在迴路中

大多數生產環境的代理部署包含人類監督：代理提議行動，人類批准或修正，代理繼續。這種「人在迴路中」的方法犧牲了完全的自主性以換取可靠性。趨勢是對低風險行動（讀取檔案、搜尋）給予更廣泛的自主權，對高風險行動（發送電子郵件、進行購買、修改生產系統）則需要人類批准。適當的自主程度取決於錯誤的成本。

自主代理

為什麼重要

深度解析

可靠性是瓶頸

人在迴路中

相關概念