Zubnet AIAprenderWiki › Image-to-Image
Using AI

Image-to-Image

img2img, Image Conditioning
Gerar uma nova imagem baseada em uma imagem existente mais um prompt textual. Em vez de começar de ruído puro (text-to-image), o processo de difusão começa de uma versão ruidosa da imagem de entrada, preservando sua estrutura enquanto a modifica de acordo com o prompt. “Uma versão cyberpunk dessa foto” mantém a composição mas transforma o estilo e os detalhes.

Por que importa

Image-to-image é a ponte entre fotografia e arte IA. Te deixa usar esboços, fotos ou obras existentes como ponto de partida, mantendo layout e composição enquanto a IA transforma estilo, adiciona detalhe ou reimagina o conteúdo. É mais controlável que text-to-image porque você guia a saída com estrutura visual, não só palavras.

Deep Dive

The mechanism: take the input image, encode it to latent space (via the VAE encoder), add noise proportional to a "denoising strength" parameter (0.0 = no change, 1.0 = pure noise = text-to-image), then denoise conditioned on the text prompt. At strength 0.3, the output closely resembles the input with subtle modifications. At strength 0.8, it's largely reimagined but keeps the basic composition.

Denoising Strength

The denoising strength is the key parameter: it controls how much the output can deviate from the input. Low strength (0.2–0.4): minor style changes, color adjustments, subtle detail additions. Medium strength (0.5–0.7): significant style transformation while preserving composition. High strength (0.8–1.0): major reimagining, only vague structural similarity to the input. Finding the right strength for your use case requires experimentation.

Sketch-to-Image

A powerful img2img workflow: draw a rough sketch (even in MS Paint), use it as the input image with medium-high denoising strength, and describe the desired output. The sketch provides spatial layout (where objects are, their relative sizes) while the AI fills in all the artistic detail. This makes AI image generation accessible to anyone who can draw a stick figure — the composition comes from you, the rendering from the AI.

Conceitos relacionados

← Todos os termos
ESC