Zubnet AI學習Wiki › Loss Function
訓練

Loss Function(損失函數)

別名:目標函數

衡量預測的錯誤程度。對 LLM 來說:交叉熵損失 = 對實際下一個詞元的驚訝程度。訓練的目標就是最小化這個值。

為什麼重要

訓練的指南針。理解損失函數有助於解讀訓練曲線和診斷問題。

深度解析

交叉熵:−log(P(正確詞元))。困惑度 = exp(損失)。損失不代表一切:經過對齊的模型可能有較高的損失,但更加實用。

相關概念

← 所有術語