模型注册表：定义与含义 — AI 维基

一个集中化的系统，用于在整个生命周期中对训练好的机器学习模型进行版本管理、追踪和管理。类似于包注册表（npm、PyPI），但面向ML模型：每个模型版本与其元数据（训练数据、超参数、性能指标、血统）一起存储，使得复现结果、比较版本和部署特定模型到生产成为可能。

为什么重要

没有模型注册表，ML开发会变成混乱：生产中运行的是哪个版本的模型？它是在什么数据上训练的？我们上次更新是什么时候？谁训练的？模型注册表回答所有这些问题，并为可复现、可审计和可靠的ML部署提供基础。对于任何在生产中运行模型的团队来说，它是必不可少的基础设施。

深度解析

模型注册表通常存储：模型工件（权重、配置）、训练元数据（超参数、数据集版本、训练时长）、评估指标（准确率、延迟、跨人口统计学的公平性指标）、部署状态（哪个版本正在生产中服务）和血统（哪个实验、代码提交和数据管道产出了这个模型）。MLflow Model Registry、Weights & Biases和SageMaker Model Registry是流行的实现。

部署流水线

在生产工作流中，模型注册表是训练和服务之间的交接点：数据科学家训练和评估模型，注册最佳模型，审核者批准它，部署系统拉取批准的模型并提供服务。这种关注点分离——训练不直接接触生产，部署只使用注册表批准的模型——降低了部署损坏模型的风险。

对于LLM

LLM注册表有特殊需求：模型非常大（数十到数百GB），微调变体共享公共基础模型（单独存储适配器），评估更复杂（自动化基准 + 人工评估 + 安全检查）。Hugging Face Hub作为开源社区的事实标准模型注册表，提供模型卡片、版本管理和评估结果。企业团队通常使用私有注册表来管理专有模型。