無分類器引導(Ho & Salimans, 2022)的運作方式是在每一步計算兩個去噪預測:一個條件式的(使用你的提示)和一個無條件式的(忽略提示)。最終預測放大差異:輸出 = 無條件 + 比例 ×(條件 − 無條件)。比例=1 表示沒有引導(僅使用條件式預測)。比例=7 表示模型將提示的影響力放大到其自然值的 7 倍。
更高的引導使影像更「符合提示」,但代價是:模型會過度反應,產生過度飽和的顏色、不自然的光線和視覺瑕疵。非常高的引導(15+)通常產生看起來像被銳化過濾器處理過的影像——技術上符合提示但在美學上很差。最佳範圍因模型而異:SD 1.5 在 7–9 效果好,SDXL 在 5–8,Flux 在 3–5。
進階技術在生成過程中操控引導:從高引導開始(確立構圖)並在後期步驟降低(自然地細化細節)。負 CFG(引導比例低於 1)反轉提示的效果,生成與描述相反的內容——對理解模型與特定概念的關聯有用,但很少用於實際影像生成。