ZUBNET
AI
☰
Pulse
Create
LLM
Image
Video
Audio
3D
Code
Explore
Models
MCP Store
Learn
Guides
Perspectives
Wiki
New
News
Ctrl+K
繁體 ▾
English
Français
Español
Português
简体中文
繁體中文
हिन्दी
🌙
Open Platform →
Zubnet AI
›
學習
›
Wiki
› Synthetic Data
訓練
Synthetic Data(合成資料)
別名:AI 生成的訓練資料
由 AI 模型生成的訓練資料。已成為訓練管線中的標準做法。
為什麼重要
真實的標記資料很昂貴。前沿模型可以在一夜之間生成數百萬個範例。品質控制至關重要。
深度解析
用途貫穿整個管線:預訓練的資料缺口、微調範例、對齊回應、評估。模型崩潰風險:錯誤會在跨代中累積。關於智慧財產權繼承的法律問題仍未解決。
相關概念
← 所有術語