Zubnet AI學習Wiki › Synthetic Data
訓練

Synthetic Data(合成資料)

別名:AI 生成的訓練資料

由 AI 模型生成的訓練資料。已成為訓練管線中的標準做法。

為什麼重要

真實的標記資料很昂貴。前沿模型可以在一夜之間生成數百萬個範例。品質控制至關重要。

深度解析

用途貫穿整個管線:預訓練的資料缺口、微調範例、對齊回應、評估。模型崩潰風險:錯誤會在跨代中累積。關於智慧財產權繼承的法律問題仍未解決。

相關概念

← 所有術語