训练

Data Augmentation

通过创建现有样本的修改版本来人工扩展训练数据集的技术。对于图像：翻转、旋转、裁剪、颜色偏移。对于文本：释义、回译、同义词替换。对于音频：速度变化、噪声注入。目标是教模型不变性——猫就是猫，无论图像是翻转的、变暗的还是裁剪的。

为什么重要

数据增强是在数据有限时提高模型性能的最廉价方式。它通过向模型展示每个样本的多种变体来减少过拟合，教它关注本质特征而非表面细节。在计算机视觉中，增强通常能免费带来2至5%的准确率提升。

深度解析

关键原则：增强必须保持标签不变。水平翻转一张猫的图片仍然显示的是猫（有效增强）。翻转一个“左转”标志使其变成“右转”标志（无效增强）。选择合适的增强需要理解哪些不变性对你的任务重要。

现代增强

AutoAugment及其后续（RandAugment、TrivialAugment）学习或随机化增强策略，而非手动设计。Cutout/CutMix随机遮盖或混合不同图像的区块。MixUp在样本对之间进行插值，创建平滑决策边界的合成训练点。这些技术现在是视觉训练管道的标准组成部分。

AI驱动的增强

借助生成模型，增强超越了几何变换。你可以使用LLM来释义文本训练数据，使用扩散模型生成变体图像，或使用模型创建全新的训练样本（合成数据）。“增强”（修改现有样本）和“合成数据”（生成新样本）之间的界限正在模糊，两者都在成为现代训练管道的重要组成部分。

相关概念

← 所有术语

← Cursor Dataset →