Un registro de modelos típicamente almacena: el artefacto del modelo (pesos, configuración), metadatos de entrenamiento (hiperparámetros, versión del dataset, duración de entrenamiento), métricas de evaluación (precisión, latencia, métricas de equidad entre demografías), estado de despliegue (qué versión está sirviendo en producción) y linaje (qué experimento, commit de código y pipeline de datos produjo este modelo). MLflow Model Registry, Weights & Biases y SageMaker Model Registry son implementaciones populares.
En flujos de trabajo de producción, el registro de modelos es el punto de traspaso entre entrenamiento y servicio: un data scientist entrena y evalúa modelos, registra el mejor, un revisor lo aprueba, y el sistema de despliegue obtiene el modelo aprobado y lo sirve. Esta separación de preocupaciones — el entrenamiento no toca producción directamente, el despliegue solo usa modelos aprobados del registro — reduce el riesgo de desplegar modelos rotos.
Los registros de LLMs tienen necesidades específicas: los modelos son muy grandes (decenas a cientos de GB), las variantes ajustadas comparten un modelo base común (almacenar adaptadores por separado), y la evaluación es más compleja (benchmarks automatizados + evaluación humana + verificaciones de seguridad). Hugging Face Hub sirve como registro de modelos de facto para la comunidad open-source, con model cards, versionado y resultados de evaluación. Los equipos empresariales a menudo usan registros privados para modelos propietarios.