El negocio principal de Scale es el etiquetado de datos a escala masiva: millones de imágenes etiquetadas para conducción autónoma (cuadros delimitadores, máscaras de segmentación, marcas de carril), anotaciones de texto para NLP (entidades nombradas, sentimiento, clasificación de intención), y datos de preferencia RLHF para alineación de LLMs. Gestionan una fuerza laboral global de etiquetadores con procesos especializados de control de calidad — el etiquetado para IA requiere una consistencia que las plataformas de crowdsourcing solas no pueden proporcionar.
Los servicios de RLHF de Scale ilustran la infraestructura humana detrás de la alineación de IA. Anotadores capacitados comparan salidas de modelos, califican respuestas por utilidad y seguridad, y proporcionan los datos de preferencia que impulsan el entrenamiento DPO/RLHF. La calidad de estas anotaciones afecta directamente el comportamiento del modelo — un etiquetado inconsistente o sesgado produce modelos inconsistentemente alineados. Scale invierte fuertemente en capacitación de anotadores, guías y métricas de acuerdo entre anotadores.