模型註冊表通常儲存:模型人工產物(權重、配置)、訓練元資料(超參數、資料集版本、訓練時長)、評估指標(準確率、延遲、跨人口統計群體的公平性指標)、部署狀態(哪個版本正在生產環境中服務),以及血統(哪個實驗、程式碼提交和資料管線產生了這個模型)。MLflow Model Registry、Weights & Biases 和 SageMaker Model Registry 是常見的實作方案。
在生產工作流程中,模型註冊表是訓練和服務之間的交接點:資料科學家訓練和評估模型,註冊最佳模型,審查者批准它,部署系統拉取已批准的模型並提供服務。這種關注點分離——訓練不直接接觸生產環境,部署只使用註冊表批准的模型——降低了部署有問題的模型的風險。
LLM 註冊表有特定的需求:模型非常大(數十到數百 GB),微調變體共享一個共同的基礎模型(單獨儲存適配器),評估更加複雜(自動化基準 + 人工評估 + 安全檢查)。Hugging Face Hub 作為開源社群的事實上的模型註冊表,提供模型卡、版本控制和評估結果。企業團隊通常為專有模型使用私有註冊表。