Model Registry: Definition & Meaning — AI Wiki

Un système centralisé pour versioner, tracker et gérer les modèles de machine learning entraînés à travers leur cycle de vie. Comme un package registry (npm, PyPI) mais pour les modèles ML : chaque version de modèle est stockée avec ses métadonnées (données d'entraînement, hyperparamètres, métriques de performance, lignée), rendant possible de reproduire des résultats, comparer les versions et déployer des modèles spécifiques en production.

Pourquoi c'est important

Sans model registry, le développement ML devient chaos : quelle version du modèle est en production ? Sur quelles données a-t-il été entraîné ? Quand l'a-t-on mis à jour pour la dernière fois ? Qui l'a entraîné ? Un model registry répond à toutes ces questions et fournit le fondement pour un déploiement ML reproductible, auditable et fiable. C'est une infrastructure essentielle pour toute équipe qui fait tourner des modèles en production.

Deep Dive

A model registry typically stores: the model artifact (weights, configuration), training metadata (hyperparameters, dataset version, training duration), evaluation metrics (accuracy, latency, fairness metrics across demographics), deployment status (which version is serving in production), and lineage (which experiment, code commit, and data pipeline produced this model). MLflow Model Registry, Weights & Biases, and SageMaker Model Registry are popular implementations.

The Deployment Pipeline

In production workflows, the model registry is the handoff point between training and serving: a data scientist trains and evaluates models, registers the best one, a reviewer approves it, and the deployment system pulls the approved model and serves it. This separation of concerns — training doesn't directly touch production, deployment only uses registry-approved models — reduces the risk of deploying broken models.

For LLMs

LLM registries have specific needs: models are very large (tens to hundreds of GB), fine-tuned variants share a common base model (store adapters separately), and evaluation is more complex (automated benchmarks + human evaluation + safety checks). Hugging Face Hub serves as a de facto model registry for the open-source community, with model cards, versioning, and evaluation results. Enterprise teams often use private registries for proprietary models.

Model Registry

Pourquoi c'est important

Deep Dive

The Deployment Pipeline

For LLMs

Concepts liés