Una ficha de modelo típicamente incluye: detalles del modelo (arquitectura, versión, fecha), uso previsto (para qué está diseñado el modelo y para qué no debería usarse), datos de entrenamiento (descripción del dataset de entrenamiento, incluyendo sesgos conocidos), métricas de rendimiento (desglosadas por subgrupos relevantes), limitaciones (modos de fallo conocidos, casos límite) y consideraciones éticas (daños potenciales, estrategias de mitigación).
Hugging Face popularizó las fichas de modelo al requerirlas para todos los modelos en su Hub. La calidad varía ampliamente — algunas son documentos técnicos detallados, otras son marcadores de posición superficiales. Las mejores fichas de modelo incluyen desgloses de rendimiento por grupo (¿el modelo funciona igual de bien para diferentes idiomas, demografías o dominios?), ejemplos concretos de casos de fallo y evaluaciones honestas de limitaciones en lugar de lenguaje de marketing.
El concepto se extiende más allá de los modelos: las fichas de datos documentan datasets (metodología de recopilación, proceso de anotación, sesgos conocidos) y las fichas de sistema documentan sistemas de IA completos (modelo + post-procesamiento + salvaguardas + contexto de despliegue). Anthropic publica fichas de sistema para los lanzamientos de Claude. Estos documentos más amplios capturan información que las fichas de modelo por sí solas no captan — un modelo puede ser seguro de forma aislada pero peligroso cuando se despliega con ciertas capacidades de uso de herramientas o sin filtros de contenido.