O negócio principal da Scale é rotulagem de dados em escala massiva: milhões de imagens rotuladas para direção autônoma (bounding boxes, máscaras de segmentação, marcações de faixa), anotações de texto para NLP (entidades nomeadas, sentimento, classificação de intenção) e dados de preferência RLHF para alinhamento de LLMs. Eles gerenciam uma força de trabalho global de anotadores com processos especializados de controle de qualidade — rotulagem para IA requer consistência que plataformas de crowdsourcing sozinhas não conseguem fornecer.
Os serviços de RLHF da Scale ilustram a infraestrutura humana por trás do alinhamento de IA. Anotadores qualificados comparam saídas de modelos, avaliam respostas por utilidade e inofensividade, e fornecem os dados de preferência que impulsionam o treinamento DPO/RLHF. A qualidade dessas anotações afeta diretamente o comportamento do modelo — rotulagem inconsistente ou enviesada produz modelos alinhados de forma inconsistente. Scale investe pesadamente em treinamento de anotadores, diretrizes e métricas de concordância entre anotadores.