Zubnet AI學習Wiki › Guidance Scale
使用AI

Guidance Scale

別名:CFG 比例、無分類器引導
控制影像生成模型遵循文字提示強度的參數。低引導(1–3):模型自由生成,產生多樣但可能偏離主題的影像。高引導(7–15):模型嚴格遵循提示,但可能產生飽和度過高、帶有瑕疵的影像。通常的最佳範圍是 7–9。它是影像生成中相當於文字模型溫度的參數。

為什麼重要

引導比例是影像生成中僅次於提示的最具影響力的參數。太低,影像會忽略你的描述。太高,影像看起來過度飽和且不自然。理解引導比例有助於你排除「為什麼我的影像不符合提示?」(引導太低)和「為什麼我的影像看起來奇怪?」(引導太高)的問題。

深度解析

無分類器引導(Ho & Salimans, 2022)的運作方式是在每一步計算兩個去噪預測:一個條件式的(使用你的提示)和一個無條件式的(忽略提示)。最終預測放大差異:輸出 = 無條件 + 比例 ×(條件 − 無條件)。比例=1 表示沒有引導(僅使用條件式預測)。比例=7 表示模型將提示的影響力放大到其自然值的 7 倍。

為什麼更高不一定更好

更高的引導使影像更「符合提示」,但代價是:模型會過度反應,產生過度飽和的顏色、不自然的光線和視覺瑕疵。非常高的引導(15+)通常產生看起來像被銳化過濾器處理過的影像——技術上符合提示但在美學上很差。最佳範圍因模型而異:SD 1.5 在 7–9 效果好,SDXL 在 5–8,Flux 在 3–5。

動態與負 CFG

進階技術在生成過程中操控引導:從高引導開始(確立構圖)並在後期步驟降低(自然地細化細節)。負 CFG(引導比例低於 1)反轉提示的效果,生成與描述相反的內容——對理解模型與特定概念的關聯有用,但很少用於實際影像生成。

相關概念

← 所有術語
ESC
Start typing to search...