Zubnet AI學習Wiki › Model Registry
基礎設施

Model Registry

別名:模型儲存庫、模型目錄
一個集中式系統,用於在整個生命週期中對訓練好的機器學習模型進行版本控制、追蹤和管理。就像套件註冊表(npm、PyPI)但用於 ML 模型:每個模型版本連同其元資料(訓練資料、超參數、效能指標、血統)一起儲存,使得重現結果、比較版本和部署特定模型到生產環境成為可能。

為什麼重要

沒有模型註冊表,ML 開發就會變成混亂:哪個版本的模型在生產環境中?它在什麼資料上訓練的?我們上次是什麼時候更新的?誰訓練的?模型註冊表回答所有這些問題,並為可重現、可審計和可靠的 ML 部署提供基礎。它是任何在生產環境中運行模型的團隊的必要基礎設施。

深度解析

模型註冊表通常儲存:模型人工產物(權重、配置)、訓練元資料(超參數、資料集版本、訓練時長)、評估指標(準確率、延遲、跨人口統計群體的公平性指標)、部署狀態(哪個版本正在生產環境中服務),以及血統(哪個實驗、程式碼提交和資料管線產生了這個模型)。MLflow Model Registry、Weights & Biases 和 SageMaker Model Registry 是常見的實作方案。

部署管線

在生產工作流程中,模型註冊表是訓練和服務之間的交接點:資料科學家訓練和評估模型,註冊最佳模型,審查者批准它,部署系統拉取已批准的模型並提供服務。這種關注點分離——訓練不直接接觸生產環境,部署只使用註冊表批准的模型——降低了部署有問題的模型的風險。

對於 LLM

LLM 註冊表有特定的需求:模型非常大(數十到數百 GB),微調變體共享一個共同的基礎模型(單獨儲存適配器),評估更加複雜(自動化基準 + 人工評估 + 安全檢查)。Hugging Face Hub 作為開源社群的事實上的模型註冊表,提供模型卡、版本控制和評估結果。企業團隊通常為專有模型使用私有註冊表。

相關概念

← 所有術語
ESC
Start typing to search...