Zubnet AI学习Wiki › Data Augmentation
训练

Data Augmentation

通过创建现有样本的修改版本来人工扩展训练数据集的技术。对于图像:翻转、旋转、裁剪、颜色偏移。对于文本:释义、回译、同义词替换。对于音频:速度变化、噪声注入。目标是教模型不变性——猫就是猫,无论图像是翻转的、变暗的还是裁剪的。

为什么重要

数据增强是在数据有限时提高模型性能的最廉价方式。它通过向模型展示每个样本的多种变体来减少过拟合,教它关注本质特征而非表面细节。在计算机视觉中,增强通常能免费带来2至5%的准确率提升。

深度解析

关键原则:增强必须保持标签不变。水平翻转一张猫的图片仍然显示的是猫(有效增强)。翻转一个“左转”标志使其变成“右转”标志(无效增强)。选择合适的增强需要理解哪些不变性对你的任务重要。

现代增强

AutoAugment及其后续(RandAugment、TrivialAugment)学习或随机化增强策略,而非手动设计。Cutout/CutMix随机遮盖或混合不同图像的区块。MixUp在样本对之间进行插值,创建平滑决策边界的合成训练点。这些技术现在是视觉训练管道的标准组成部分。

AI驱动的增强

借助生成模型,增强超越了几何变换。你可以使用LLM来释义文本训练数据,使用扩散模型生成变体图像,或使用模型创建全新的训练样本(合成数据)。“增强”(修改现有样本)和“合成数据”(生成新样本)之间的界限正在模糊,两者都在成为现代训练管道的重要组成部分。

相关概念

← 所有术语
← Cursor Dataset →