技术上,反向提示通过无分类器引导(CFG)工作。在生成过程中,模型计算两个预测:一个以正向提示为条件,一个以反向提示为条件。最终预测朝向正向条件并远离负向条件:final = negative + scale × (positive − negative)。引导比例控制模型遵循提示的强度。
社区已开发出针对常见问题的标准反向提示:“blurry, low quality, jpeg artifacts”(质量),“extra fingers, deformed hands, extra limbs”(解剖结构),“text, watermark, signature, logo”(不需要的元素),“ugly, disfigured, bad proportions”(一般质量)。许多用户在每次生成时都有一个默认的反向提示。自定义反向提示解决领域特定的问题。
反向提示适用于支持无分类器引导的模型(大多数Stable Diffusion变体、Flux)。DALL-E 3和Midjourney不将反向提示作为面向用户的功能——它们通过提示重写和内部质量机制处理质量问题。新模型的趋势是通过提高默认质量来减少对反向提示的需求,但它们在开放模型中对精确控制仍然很有价值。