Um registro de modelos tipicamente armazena: o artefato do modelo (pesos, configuração), metadados de treinamento (hiperparâmetros, versão do dataset, duração do treinamento), métricas de avaliação (acurácia, latência, métricas de equidade entre demografias), status de implantação (qual versão está servindo em produção) e linhagem (qual experimento, commit de código e pipeline de dados produziram este modelo). MLflow Model Registry, Weights & Biases e SageMaker Model Registry são implementações populares.
Em fluxos de trabalho de produção, o registro de modelos é o ponto de transferência entre treinamento e serving: um cientista de dados treina e avalia modelos, registra o melhor, um revisor o aprova, e o sistema de implantação puxa o modelo aprovado e o serve. Essa separação de responsabilidades — treinamento não toca produção diretamente, implantação só usa modelos aprovados pelo registro — reduz o risco de implantar modelos quebrados.
Registros de LLMs têm necessidades específicas: modelos são muito grandes (dezenas a centenas de GB), variantes ajustadas compartilham um modelo base comum (armazene adaptadores separadamente), e a avaliação é mais complexa (benchmarks automatizados + avaliação humana + verificações de segurança). Hugging Face Hub serve como um registro de modelos de fato para a comunidade open-source, com model cards, versionamento e resultados de avaliação. Equipes empresariais frequentemente usam registros privados para modelos proprietários.