訓練

Loss Function（損失函數）

別名：目標函數

衡量預測的錯誤程度。對 LLM 來說：交叉熵損失 = 對實際下一個詞元的驚訝程度。訓練的目標就是最小化這個值。

為什麼重要

訓練的指南針。理解損失函數有助於解讀訓練曲線和診斷問題。

交叉熵：−log(P(正確詞元))。困惑度 = exp(損失)。損失不代表一切：經過對齊的模型可能有較高的損失，但更加實用。