關鍵原則:增強必須保留標籤。水平翻轉一張貓的影像仍然是貓(有效增強)。翻轉一個「左轉」標誌會使它變成「右轉」標誌(無效增強)。選擇適當的增強需要理解什麼不變性對你的任務重要。
AutoAugment 及其後續技術(RandAugment、TrivialAugment)學習或隨機化增強策略,而非手動設計。Cutout/CutMix 隨機遮蔽或混合不同影像的區塊。MixUp 在樣本對之間進行內插,建立平滑決策邊界的合成訓練點。這些技術現在是視覺訓練流程的標準配備。
隨著生成式模型的出現,增強超越了幾何變換。你可以使用 LLM 改寫文本訓練資料,使用擴散模型生成變體影像,或使用模型建立全新的訓練樣本(合成資料)。「增強」(修改現有樣本)和「合成資料」(生成新樣本)之間的界線正在模糊,兩者都正成為現代訓練流程中不可或缺的部分。