Zubnet AI学习Wiki › 模型注册表
基础设施

模型注册表

别名:模型存储、模型目录
一个集中化的系统,用于在整个生命周期中对训练好的机器学习模型进行版本管理、追踪和管理。类似于包注册表(npm、PyPI),但面向ML模型:每个模型版本与其元数据(训练数据、超参数、性能指标、血统)一起存储,使得复现结果、比较版本和部署特定模型到生产成为可能。

为什么重要

没有模型注册表,ML开发会变成混乱:生产中运行的是哪个版本的模型?它是在什么数据上训练的?我们上次更新是什么时候?谁训练的?模型注册表回答所有这些问题,并为可复现、可审计和可靠的ML部署提供基础。对于任何在生产中运行模型的团队来说,它是必不可少的基础设施。

深度解析

模型注册表通常存储:模型工件(权重、配置)、训练元数据(超参数、数据集版本、训练时长)、评估指标(准确率、延迟、跨人口统计学的公平性指标)、部署状态(哪个版本正在生产中服务)和血统(哪个实验、代码提交和数据管道产出了这个模型)。MLflow Model Registry、Weights & Biases和SageMaker Model Registry是流行的实现。

部署流水线

在生产工作流中,模型注册表是训练和服务之间的交接点:数据科学家训练和评估模型,注册最佳模型,审核者批准它,部署系统拉取批准的模型并提供服务。这种关注点分离——训练不直接接触生产,部署只使用注册表批准的模型——降低了部署损坏模型的风险。

对于LLM

LLM注册表有特殊需求:模型非常大(数十到数百GB),微调变体共享公共基础模型(单独存储适配器),评估更复杂(自动化基准 + 人工评估 + 安全检查)。Hugging Face Hub作为开源社区的事实标准模型注册表,提供模型卡片、版本管理和评估结果。企业团队通常使用私有注册表来管理专有模型。

← 所有术语