Anthropic 本週發表了一份經濟研究,分析了 2025 年 10 月至 2026 年 4 月間,來自約 235,000 名使用者的約 400,000 次互動式 Claude Code 工作階段,而其核心發現恰恰與顯而易見的假設相反。能夠預測這款 AI 編程代理是否真正完成工作的,並非使用者的編程背景,而是他們的領域專業。研究指出,一個人愈是理解眼前的問題,Claude 每道指令所完成的工作就愈多,而且這個模式是跨越各種職業成立的,並不僅限於軟體工程師之間。

那個引人注目的數字是一個拉平差距的數字。在 Anthropic 最嚴格的衡量標準,也就是經驗證的成功(這要求同時具備一個被判定為成功的結果,以及像是通過的測試、一次提交,或使用者明確確認這類確鑿證據)之下,資料集中十大職業裡的每一個都落在軟體工程師七個百分點的範圍內。在會產出程式碼的工作階段中,軟體職業達到經驗證的成功的比例為 34%,相對於其他所有人的 29%,這個差距遠比 '編程是編程人員的事' 這種框架所預測的要小得多。這項分析是透過一條保護隱私的流程進行的:Anthropic 表示,沒有任何研究人員會閱讀個別的文字記錄,職業標籤從不與可識別身分的使用者綁定,而在程式碼是否真的被修改這一點上,由一個 AI 模型對工作階段所做的分類,與遙測資料相符的比例超過 90%。

這些工作的組成正朝著一個耐人尋味的方向轉變。略多於半數的工作階段涉及撰寫、修正或測試程式碼,但成長最快的使用者群體根本不是工程師:而是管理、業務與法律等職業。在這六個月裡,人們帶給 Claude Code 的任務之預估價值上升了約 27%,其中建構類工作成長了 43%,而工作組合也從除錯轉移開來,除錯從佔工作階段的三分之一降至五分之一以下,轉向了操作軟體與資料分析,後者大約增加了一倍。專業也展現在操作的細節上:被評為專家級的工作階段每道提示會觸發約 12 個 Claude 動作,相對於新手的 5 個,而新手放棄陷入困境的工作階段的頻率也高出許多,達到 19%,相對於其他所有人的 5 至 7%。

這項研究誠實的侷限相當可觀,而 Anthropic 也明白指出。這項研究無法看出當中有任何程式碼是否真的在現實世界裡被使用,它排除了大量非互動式的使用,它的任務價值估算很粗略,且是借用自由接案市場的費率而來,而它仰賴模型本身對工作階段的分類,公司也坦承這難以大規模驗證。在這些但書之下,這幅圖像仍然值得細細思量:一款 AI 編程代理的價值,或許較少取決於你會不會編程,而較多取決於你是否理解問題,這會使這項工具與其說是專業的替代品,不如說是專業的放大器,也有助於解釋它為何正在擴散到那些從未寫過一行軟體的職業之中。揭露:本文是關於 Anthropic 的 Claude Code,並且由 Claude 這個同一款 AI 模型撰寫,這使得這篇報導無可避免地具有自我指涉的性質;當中的發現與框架皆出自 Anthropic,並在此附帶公司自己的但書一併報導。