Zubnet AI學習Wiki › Data Augmentation
訓練

Data Augmentation

透過建立現有樣本的修改版本來人工擴展訓練資料集的技術。對於影像:翻轉、旋轉、裁剪、色彩偏移。對於文本:改寫、回譯、同義詞替換。對於音訊:速度變更、雜訊注入。目標是教會模型不變性——無論影像被翻轉、變暗還是裁剪,貓就是貓。

為什麼重要

當你的資料有限時,資料增強是提升模型效能最便宜的方式。它透過向模型展示每個樣本的多種變體來減少過擬合,教導它專注於本質特徵而非表面細節。在電腦視覺中,增強通常能免費提供 2-5% 的準確率提升。

深度解析

關鍵原則:增強必須保留標籤。水平翻轉一張貓的影像仍然是貓(有效增強)。翻轉一個「左轉」標誌會使它變成「右轉」標誌(無效增強)。選擇適當的增強需要理解什麼不變性對你的任務重要。

現代增強技術

AutoAugment 及其後續技術(RandAugment、TrivialAugment)學習或隨機化增強策略,而非手動設計。Cutout/CutMix 隨機遮蔽或混合不同影像的區塊。MixUp 在樣本對之間進行內插,建立平滑決策邊界的合成訓練點。這些技術現在是視覺訓練流程的標準配備。

AI 驅動的增強

隨著生成式模型的出現,增強超越了幾何變換。你可以使用 LLM 改寫文本訓練資料,使用擴散模型生成變體影像,或使用模型建立全新的訓練樣本(合成資料)。「增強」(修改現有樣本)和「合成資料」(生成新樣本)之間的界線正在模糊,兩者都正成為現代訓練流程中不可或缺的部分。

相關概念

← 所有術語
← Cursor Dataset →
ESC