Zubnet AI学习Wiki › 数据标注
训练

数据标注

别名:数据标签、数据注释
为原始数据添加标签、标记或元数据以便用于监督学习的过程。标注图像意味着在物体周围绘制边界框。标注文本意味着标记实体、情感或意图。为RLHF标注意味着按质量对模型回复进行排序。标注是将原始数据转化为训练数据的人力劳动。

为什么重要

标注是监督AI的朴素基础。每个标注数据集、每个微调模型、每个对齐的助手都依赖于花费数小时正确标注数据的人类标注者。标注的质量直接决定模型质量——不一致或有偏差的标注会产生不一致和有偏差的模型。它是构建AI系统中最劳动密集且通常最昂贵的部分。

深度解析

标注工作流通常包括:(1)创建清晰的标注指南(什么算“正面情感”?边界框中“汽车”的边界在哪里?),(2)根据指南培训标注者,(3)每个样本由多个标注者标注(用于质量控制),(4)衡量标注者间一致性(标注者是否在标签上达成一致?),(5)解决分歧(通过裁定或多数投票)。低一致性通常表明指南模糊或数据本身确实模糊。

RLHF标注

对于LLM对齐,标注意味着比较模型回复:“对于这个提示,回复A还是回复B更好?”这种偏好标注特别具有挑战性,因为“更好”是主观的、依赖上下文的、且因文化而异。标注者的人口统计学特征、专业知识和指令都会影响最终的偏好数据,进而塑造模型行为。这就是为什么对齐常被描述为编码了撰写标注指南的人的价值观。

AI辅助标注

AI模型越来越多地协助标注:预标注数据然后由人类纠正(比从头标注更快)、生成合成标注数据、或作为额外标注者与人类一起工作。这创造了一个有趣的反馈循环:AI帮助标注训练更好的AI的数据。风险在于AI辅助标注会继承辅助模型的偏差,因此人类监督仍然至关重要。

相关概念

← 所有术语
← 数据中心 文字转语音 →