Ruby貢獻者Yusuke Endoh透過600次測試執行Claude Code,在13種程式語言中實作簡化版Git,結果顯示動態語言始終優於靜態替代方案。Ruby平均每次執行成本$0.36,耗時73秒,Python達到$0.38用時75秒,JavaScript為$0.39用時81秒。與此同時,Go成本$0.50且變異很大(標準差37秒),Rust平均$0.54且測試失敗最多,C膨脹到$0.74,產生517行程式碼而Ruby只有219行。

型別系統的懲罰深深影響了許多團隊正在建構的AI編程工作流程。加入mypy嚴格檢查使Python慢了1.6-1.7倍,而Ruby的Steep型別檢查器施加了殘酷的2.0-3.2倍減速。TypeScript比JavaScript貴59%,儘管程式碼行數相似,這表明模型在與型別約束搏鬥時燃燒額外的思考tokens,而不是僅僅產生註釋。這不是關於型別化不好——而是關於LLM在產生程式碼時難以處理滿足型別系統的認知負擔。

Endoh對他的Ruby偏見和實驗局限性很透明:200行原型不能反映企業程式碼庫,在那裡靜態型別會帶來紅利。Anthropic透過其Open Source Program贊助了這項研究,提供了免費的Claude存取權限,但這並不會使方法論失效。基準測試只測量了產生成本和速度,忽略了程式碼品質、可維護性或bug率——這些指標中靜態型別可能會奪回優勢。

對於評估AI編程助手的團隊,這建議從動態語言開始快速原型設計,然後有選擇地加入型別,而不是預設使用TypeScript或Rust。當你每月產生數千個程式碼片段時,40-60%的成本差異會快速累積。