訓練

Data Augmentation

透過建立現有樣本的修改版本來人工擴展訓練資料集的技術。對於影像：翻轉、旋轉、裁剪、色彩偏移。對於文本：改寫、回譯、同義詞替換。對於音訊：速度變更、雜訊注入。目標是教會模型不變性——無論影像被翻轉、變暗還是裁剪，貓就是貓。

為什麼重要

當你的資料有限時，資料增強是提升模型效能最便宜的方式。它透過向模型展示每個樣本的多種變體來減少過擬合，教導它專注於本質特徵而非表面細節。在電腦視覺中，增強通常能免費提供 2-5% 的準確率提升。

深度解析

關鍵原則：增強必須保留標籤。水平翻轉一張貓的影像仍然是貓（有效增強）。翻轉一個「左轉」標誌會使它變成「右轉」標誌（無效增強）。選擇適當的增強需要理解什麼不變性對你的任務重要。

現代增強技術

AutoAugment 及其後續技術（RandAugment、TrivialAugment）學習或隨機化增強策略，而非手動設計。Cutout/CutMix 隨機遮蔽或混合不同影像的區塊。MixUp 在樣本對之間進行內插，建立平滑決策邊界的合成訓練點。這些技術現在是視覺訓練流程的標準配備。

AI 驅動的增強

隨著生成式模型的出現，增強超越了幾何變換。你可以使用 LLM 改寫文本訓練資料，使用擴散模型生成變體影像，或使用模型建立全新的訓練樣本（合成資料）。「增強」（修改現有樣本）和「合成資料」（生成新樣本）之間的界線正在模糊，兩者都正成為現代訓練流程中不可或缺的部分。

相關概念

← 所有術語

← Cursor Dataset →