Zubnet AIApprendreWiki › Données synthétiques
Entraînement

Données synthétiques

Aussi appelé : Données d'entraînement générées par IA
Des données d'entraînement générées par des modèles d'IA. Devenues standard dans les pipelines d'entraînement.

Pourquoi c'est important

Les vraies données étiquetées coûtent cher. Les modèles frontière génèrent des millions d'exemples du jour au lendemain. Le contrôle qualité est critique.

En profondeur

Les utilisations couvrent tout le pipeline : combler les lacunes du pré-entraînement, exemples de fine-tuning, réponses d'alignement, évaluation. Risque d'effondrement du modèle : les erreurs s'accumulent à travers les générations. Questions juridiques sur l'héritage de propriété intellectuelle.

Concepts connexes

← Tous les termes
← Distillation Double usage →
ESC