Zubnet AI学习Wiki › Image-to-Image
使用AI

Image-to-Image

别名:img2img、图像条件生成
基于现有图像加文本提示生成新图像。与从纯噪声开始的文生图不同,扩散过程从输入图像的噪声版本开始,保留其结构的同时根据提示进行修改。“这张照片的赛博朋克版本”保持构图但转换风格和细节。

为什么重要

图像到图像是摄影与AI艺术之间的桥梁。它让你使用草图、照片或现有的艺术作品作为起点,保持布局和构图的同时让AI转换风格、添加细节或重新想象内容。它比文生图更可控,因为你用视觉结构而不仅仅是文字来引导输出。

深度解析

机制:取输入图像,通过VAE编码器编码到潜空间,添加与“去噪强度”参数成比例的噪声(0.0 = 不变,1.0 = 纯噪声 = 文生图),然后在文本提示的条件下去噪。在强度0.3时,输出与输入非常相似,只有细微修改。在强度0.8时,图像被大幅重新想象,但保持基本构图。

去噪强度

去噪强度是关键参数:它控制输出可以偏离输入多远。低强度(0.2–0.4):轻微的风格变化、颜色调整、细微的细节添加。中等强度(0.5–0.7):显著的风格转换,同时保留构图。高强度(0.8–1.0):大幅重新想象,与输入仅有模糊的结构相似性。为你的使用场景找到合适的强度需要实验。

草图到图像

一个强大的img2img工作流:画一张粗略的草图(即使在画图程序中),将其用作输入图像并设置中高去噪强度,然后描述期望的输出。草图提供空间布局(物体在哪里,它们的相对大小),而AI填充所有的艺术细节。这使得任何能画火柴人的人都能使用AI图像生成——构图来自你,渲染来自AI。

相关概念

← 所有术语
ESC