Ruby贡献者Yusuke Endoh通过600次测试运行Claude Code,在13种编程语言中实现简化版Git,结果显示动态语言始终优于静态替代方案。Ruby平均每次运行成本$0.36,耗时73秒,Python达到$0.38用时75秒,JavaScript为$0.39用时81秒。与此同时,Go成本$0.50且方差很大(标准偏差37秒),Rust平均$0.54且测试失败最多,C膨胀到$0.74,生成517行代码而Ruby只有219行。

类型系统的惩罚深深影响了许多团队正在构建的AI编码工作流。添加mypy严格检查使Python慢了1.6-1.7倍,而Ruby的Steep类型检查器施加了残酷的2.0-3.2倍减速。TypeScript比JavaScript贵59%,尽管代码行数相似,这表明模型在与类型约束搏斗时燃烧额外的思考tokens,而不是仅仅生成注释。这不是关于类型化不好——而是关于LLM在生成代码时难以处理满足类型系统的认知开销。

Endoh对他的Ruby偏见和实验局限性很透明:200行原型不能反映企业代码库,在那里静态类型会带来红利。Anthropic通过其Open Source Program赞助了这项研究,提供了免费的Claude访问权限,但这并不会使方法论失效。基准测试只测量了生成成本和速度,忽略了代码质量、可维护性或bug率——这些指标中静态类型可能会夺回优势。

对于评估AI编码助手的团队,这建议从动态语言开始快速原型设计,然后有选择地添加类型,而不是默认使用TypeScript或Rust。当你每月生成数千个代码片段时,40-60%的成本差异会快速累积。