Zubnet AIAprenderWiki › Ficha de modelo
Seguridad

Ficha de modelo

También conocido como: Documentación de modelo, Hoja de datos
Un documento estandarizado que describe el uso previsto de un modelo de machine learning, sus características de rendimiento, datos de entrenamiento, limitaciones y consideraciones éticas. Introducidas por Mitchell et al. (2019), las fichas de modelo buscan aumentar la transparencia y ayudar a los usuarios a tomar decisiones informadas sobre si un modelo es apropiado para su caso de uso.

Por qué importa

Las fichas de modelo son las etiquetas nutricionales de la IA. Sin ellas, estás usando un modelo a ciegas — no sabes con qué datos fue entrenado, en qué funciona bien y mal, o qué grupos podría perjudicar. A medida que la regulación de IA aumenta (la Ley de IA de la UE requiere documentación), las fichas de modelo están pasando de ser una buena práctica a un requisito legal.

En profundidad

Una ficha de modelo típicamente incluye: detalles del modelo (arquitectura, versión, fecha), uso previsto (para qué está diseñado el modelo y para qué no debería usarse), datos de entrenamiento (descripción del dataset de entrenamiento, incluyendo sesgos conocidos), métricas de rendimiento (desglosadas por subgrupos relevantes), limitaciones (modos de fallo conocidos, casos límite) y consideraciones éticas (daños potenciales, estrategias de mitigación).

En la práctica

Hugging Face popularizó las fichas de modelo al requerirlas para todos los modelos en su Hub. La calidad varía ampliamente — algunas son documentos técnicos detallados, otras son marcadores de posición superficiales. Las mejores fichas de modelo incluyen desgloses de rendimiento por grupo (¿el modelo funciona igual de bien para diferentes idiomas, demografías o dominios?), ejemplos concretos de casos de fallo y evaluaciones honestas de limitaciones en lugar de lenguaje de marketing.

Fichas de datos y fichas de sistema

El concepto se extiende más allá de los modelos: las fichas de datos documentan datasets (metodología de recopilación, proceso de anotación, sesgos conocidos) y las fichas de sistema documentan sistemas de IA completos (modelo + post-procesamiento + salvaguardas + contexto de despliegue). Anthropic publica fichas de sistema para los lanzamientos de Claude. Estos documentos más amplios capturan información que las fichas de modelo por sí solas no captan — un modelo puede ser seguro de forma aislada pero peligroso cuando se despliega con ciertas capacidades de uso de herramientas o sin filtros de contenido.

Conceptos relacionados

ESC