机制:取输入图像,通过VAE编码器编码到潜空间,添加与“去噪强度”参数成比例的噪声(0.0 = 不变,1.0 = 纯噪声 = 文生图),然后在文本提示的条件下去噪。在强度0.3时,输出与输入非常相似,只有细微修改。在强度0.8时,图像被大幅重新想象,但保持基本构图。
去噪强度是关键参数:它控制输出可以偏离输入多远。低强度(0.2–0.4):轻微的风格变化、颜色调整、细微的细节添加。中等强度(0.5–0.7):显著的风格转换,同时保留构图。高强度(0.8–1.0):大幅重新想象,与输入仅有模糊的结构相似性。为你的使用场景找到合适的强度需要实验。
一个强大的img2img工作流:画一张粗略的草图(即使在画图程序中),将其用作输入图像并设置中高去噪强度,然后描述期望的输出。草图提供空间布局(物体在哪里,它们的相对大小),而AI填充所有的艺术细节。这使得任何能画火柴人的人都能使用AI图像生成——构图来自你,渲染来自AI。