关键原则:增强必须保持标签不变。水平翻转一张猫的图片仍然显示的是猫(有效增强)。翻转一个“左转”标志使其变成“右转”标志(无效增强)。选择合适的增强需要理解哪些不变性对你的任务重要。
AutoAugment及其后续(RandAugment、TrivialAugment)学习或随机化增强策略,而非手动设计。Cutout/CutMix随机遮盖或混合不同图像的区块。MixUp在样本对之间进行插值,创建平滑决策边界的合成训练点。这些技术现在是视觉训练管道的标准组成部分。
借助生成模型,增强超越了几何变换。你可以使用LLM来释义文本训练数据,使用扩散模型生成变体图像,或使用模型创建全新的训练样本(合成数据)。“增强”(修改现有样本)和“合成数据”(生成新样本)之间的界限正在模糊,两者都在成为现代训练管道的重要组成部分。