Model Registry（模型註冊表）：定義與含義 — AI 維基

一個集中式系統，用於在整個生命週期中對訓練好的機器學習模型進行版本控制、追蹤和管理。就像套件註冊表（npm、PyPI）但用於 ML 模型：每個模型版本連同其元資料（訓練資料、超參數、效能指標、血統）一起儲存，使得重現結果、比較版本和部署特定模型到生產環境成為可能。

為什麼重要

沒有模型註冊表，ML 開發就會變成混亂：哪個版本的模型在生產環境中？它在什麼資料上訓練的？我們上次是什麼時候更新的？誰訓練的？模型註冊表回答所有這些問題，並為可重現、可審計和可靠的 ML 部署提供基礎。它是任何在生產環境中運行模型的團隊的必要基礎設施。

深度解析

模型註冊表通常儲存：模型人工產物（權重、配置）、訓練元資料（超參數、資料集版本、訓練時長）、評估指標（準確率、延遲、跨人口統計群體的公平性指標）、部署狀態（哪個版本正在生產環境中服務），以及血統（哪個實驗、程式碼提交和資料管線產生了這個模型）。MLflow Model Registry、Weights & Biases 和 SageMaker Model Registry 是常見的實作方案。

部署管線

在生產工作流程中，模型註冊表是訓練和服務之間的交接點：資料科學家訓練和評估模型，註冊最佳模型，審查者批准它，部署系統拉取已批准的模型並提供服務。這種關注點分離——訓練不直接接觸生產環境，部署只使用註冊表批准的模型——降低了部署有問題的模型的風險。

對於 LLM

LLM 註冊表有特定的需求：模型非常大（數十到數百 GB），微調變體共享一個共同的基礎模型（單獨儲存適配器），評估更加複雜（自動化基準 + 人工評估 + 安全檢查）。Hugging Face Hub 作為開源社群的事實上的模型註冊表，提供模型卡、版本控制和評估結果。企業團隊通常為專有模型使用私有註冊表。

Model Registry

為什麼重要

深度解析

部署管線

對於 LLM

相關概念