模型卡通常包括:模型详情(架构、版本、日期)、预期用途(模型为何而设计以及不应用于什么)、训练数据(训练数据集的描述,包括已知偏差)、性能指标(按相关子群细分)、局限性(已知的失败模式、边界情况)、以及伦理考量(潜在危害、缓解策略)。
Hugging Face通过要求其Hub上所有模型都有模型卡来推广了这一做法。质量差异很大——有些是详细的技术文档,有些是敷衍的占位符。最好的模型卡包括按群体细分的性能数据(模型对不同语言、人口统计或领域是否同样有效?)、失败案例的具体示例、以及对局限性的诚实评估而非营销语言。
这一概念延伸到模型之外:数据卡记录数据集(收集方法、标注过程、已知偏差),系统卡记录整个AI系统(模型 + 后处理 + 护栏 + 部署上下文)。Anthropic为Claude的版本发布系统卡。这些更广泛的文档捕获了仅靠模型卡无法覆盖的信息——一个模型单独可能是安全的,但当与某些工具使用能力一起部署或没有内容过滤器时可能是危险的。