Zubnet AIApprendreWiki › Annotation
Entraînement

Annotation

Aussi appelé : Étiquetage de données, annotation de données
Le processus d'ajout d'étiquettes, de tags ou de métadonnées à des données brutes pour qu'elles puissent être utilisées pour l'apprentissage supervisé. Annoter des images signifie dessiner des boîtes englobantes autour des objets. Annoter du texte signifie étiqueter les entités, le sentiment ou l'intention. Annoter pour le RLHF signifie classer les réponses du modèle par qualité. L'annotation est le travail humain qui transforme les données brutes en données d'entraînement.

Pourquoi c'est important

L'annotation est le fondement peu glamour de l'IA supervisée. Chaque jeu de données étiquetées, chaque modèle ajusté, chaque assistant aligné dépend d'annotateurs humains qui ont passé des heures à étiqueter correctement les données. La qualité des annotations détermine directement la qualité du modèle — un étiquetage incohérent ou biaisé produit des modèles incohérents et biaisés. C'est la partie la plus intensive en main-d'œuvre et souvent la plus coûteuse de la construction de systèmes d'IA.

En profondeur

Les flux de travail d'annotation impliquent typiquement : (1) créer des directives d'étiquetage claires (qu'est-ce qui compte comme « sentiment positif » ? où est la frontière d'une « voiture » dans une boîte englobante ?), (2) former les annotateurs aux directives, (3) annoter les données avec plusieurs annotateurs par exemple (pour le contrôle qualité), (4) mesurer l'accord inter-annotateurs (les annotateurs sont-ils d'accord sur les étiquettes ?), et (5) résoudre les désaccords (par arbitrage ou vote majoritaire). Un faible accord indique souvent des directives ambiguës ou des données véritablement ambiguës.

Annotation RLHF

Pour l'alignement des LLM, l'annotation signifie comparer les réponses du modèle : « Est-ce que la réponse A ou la réponse B est meilleure pour ce prompt ? » Cette annotation de préférence est particulièrement difficile parce que « meilleur » est subjectif, dépend du contexte et varie culturellement. Les caractéristiques démographiques des annotateurs, leur expertise et les instructions influencent toutes les données de préférence résultantes, qui à leur tour façonnent le comportement du modèle. C'est pourquoi l'alignement est souvent décrit comme l'encodage des valeurs de celui qui rédige les directives d'annotation.

Annotation assistée par IA

De plus en plus, les modèles d'IA assistent l'annotation : pré-étiqueter les données que les humains corrigent ensuite (plus rapide que l'étiquetage à partir de zéro), générer des données d'annotation synthétiques, ou servir d'annotateurs supplémentaires aux côtés des humains. Ça crée une boucle de rétroaction intéressante : l'IA aide à étiqueter les données qui entraînent une meilleure IA. Le risque est que l'annotation assistée par IA hérite des biais du modèle assistant, donc la supervision humaine reste essentielle.

Concepts connexes

← Tous les termes
← Alignement Anthropic →