模型注册表通常存储:模型工件(权重、配置)、训练元数据(超参数、数据集版本、训练时长)、评估指标(准确率、延迟、跨人口统计学的公平性指标)、部署状态(哪个版本正在生产中服务)和血统(哪个实验、代码提交和数据管道产出了这个模型)。MLflow Model Registry、Weights & Biases和SageMaker Model Registry是流行的实现。
在生产工作流中,模型注册表是训练和服务之间的交接点:数据科学家训练和评估模型,注册最佳模型,审核者批准它,部署系统拉取批准的模型并提供服务。这种关注点分离——训练不直接接触生产,部署只使用注册表批准的模型——降低了部署损坏模型的风险。
LLM注册表有特殊需求:模型非常大(数十到数百GB),微调变体共享公共基础模型(单独存储适配器),评估更复杂(自动化基准 + 人工评估 + 安全检查)。Hugging Face Hub作为开源社区的事实标准模型注册表,提供模型卡片、版本管理和评估结果。企业团队通常使用私有注册表来管理专有模型。