Zubnet AI学习Wiki › 模型卡
安全

模型卡

别名:模型文档、数据表
一份描述机器学习模型预期用途、性能特征、训练数据、局限性和伦理考量的标准化文档。由Mitchell等人(2019)引入,模型卡旨在提高透明度,帮助用户做出关于模型是否适合其用例的明智决策。

为什么重要

模型卡是AI的营养标签。没有它们,你在盲目使用模型——你不知道它是在什么数据上训练的,它在什么方面表现好和差,或者它可能对哪些群体造成不利。随着AI监管的增加(欧盟AI法案要求文档化),模型卡正从最佳实践变为法律要求。

深度解析

模型卡通常包括:模型详情(架构、版本、日期)、预期用途(模型为何而设计以及不应用于什么)、训练数据(训练数据集的描述,包括已知偏差)、性能指标(按相关子群细分)、局限性(已知的失败模式、边界情况)、以及伦理考量(潜在危害、缓解策略)。

实践中

Hugging Face通过要求其Hub上所有模型都有模型卡来推广了这一做法。质量差异很大——有些是详细的技术文档,有些是敷衍的占位符。最好的模型卡包括按群体细分的性能数据(模型对不同语言、人口统计或领域是否同样有效?)、失败案例的具体示例、以及对局限性的诚实评估而非营销语言。

数据卡和系统卡

这一概念延伸到模型之外:数据卡记录数据集(收集方法、标注过程、已知偏差),系统卡记录整个AI系统(模型 + 后处理 + 护栏 + 部署上下文)。Anthropic为Claude的版本发布系统卡。这些更广泛的文档捕获了仅靠模型卡无法覆盖的信息——一个模型单独可能是安全的,但当与某些工具使用能力一起部署或没有内容过滤器时可能是危险的。

相关概念

← 所有术语
← 模型 模型合并 →