GitHub將其agentic CI工作流的token開銷削減了多達62%,並在gh-aw CLI中發布了該方法論——這些技術可被任何在CI/CD中執行LLM agent的團隊複用。頭條發現是大多數建構者在不測量的情況下支付的:一個暴露40個工具的MCP伺服器每輪添加10-15KB的schema,無論agent是否使用這些工具,而修剪未使用的條目在他們的smoke-test工作流中每次調用削減了8-12KB。你接入agent的每個工具在每一輪都花費脈絡token。具體結果:Auto-Triage Issues降低62% Effective-Tokens,Smoke Claude 59%,Security Guard 43%。
第二個技術是CLI替代:GitHub用gh CLI命令替換了獲取PR diff和檔案內容的MCP調用,要麼預下載到workspace檔案中,要麼透過將認證遠離agent的HTTP閘道代理。MCP是一個乾淨的協定,但對於高頻確定性獲取,它支付一個CLI調用避免的每次調用schema-和-envelope稅。測量框架是最可移植的想法:Effective Tokens(ET)指標將輸出token加權4×、快取讀取0.1×,然後應用模型乘數——Haiku 0.25×、Sonnet 1.0×、Opus 5.0×——所以一個數字跨模型比較成本並捕獲回歸。Token資料透過token-usage.jsonl製品跨CLI工具捕獲,兩個agent執行循環:一個Daily Token Usage Auditor按工作流聚合並標記昂貴的job,一個Daily Token Optimiser讀取源和日誌、打開GitHub issue並提出具體修復。
生態系統解讀:這是Uber COO標記的生產力歸因問題的成本面——如果你無法測量開銷就無法證明價值鏈,而GitHub剛剛發布了一種嚴格的測量開銷的方法。MCP schema膨脹的發現值得最多關注,因為agent生態系統一直在熱情地添加MCP伺服器而不核算工具定義的每輪脈絡成本——一個40工具伺服器是每次推理的常設稅,而大多數團隊從未看過。Effective-Tokens加權是GitHub自己的(4×/0.1×/5×數字是選擇,不是標準),但一個在模型交換中存活的歸一化成本指標的想法正是企業所缺乏的單位經濟學instrumentation。稽核員/最佳化員agent循環也是一個乾淨的自引用模式:agent最佳化agent成本,以人類可審查的GitHub issue作為輸出。
如果你週一早上在CI中執行agent:先稽核你的MCP工具列表——修剪工作流不調用的任何東西,因為你為每輪的每個schema付費。然後考慮為你最高頻的確定性獲取使用gh-CLI風格替代,並instrument一個token-usage.jsonl加一個Effective-Tokens風格指標,以便模型交換和prompt更改顯示為你能看到的成本delta。gh-aw CLI是參考實作;方法論是可轉移的部分。
