Le cœur de métier de Scale est l'étiquetage de données à grande échelle : des millions d'images étiquetées pour la conduite autonome (boîtes englobantes, masques de segmentation, marquages de voies), des annotations textuelles pour le NLP (entités nommées, sentiment, classification d'intention), et des données de préférence RLHF pour l'alignement des LLM. Ils gèrent une main-d'œuvre mondiale d'annotateurs avec des processus spécialisés de contrôle qualité — l'étiquetage pour l'IA exige une cohérence que les plateformes de crowdsourcing seules ne peuvent fournir.
Les services RLHF de Scale illustrent l'infrastructure humaine derrière l'alignement de l'IA. Des annotateurs qualifiés comparent les sorties des modèles, évaluent les réponses pour leur utilité et leur innocuité, et fournissent les données de préférence qui alimentent l'entraînement DPO/RLHF. La qualité de ces annotations affecte directement le comportement du modèle — un étiquetage incohérent ou biaisé produit des modèles alignés de manière incohérente. Scale investit fortement dans la formation des annotateurs, les directives et les métriques d'accord inter-annotateurs.