Zubnet AIAprenderWiki › Decoder
Fundamentos

Decoder

Decoder Network, Generator
Um componente de rede neural que gera saída a partir de uma representação. Nos Transformers, o decoder usa atenção causal (da esquerda para a direita) para gerar tokens um por vez. Em geração de imagens, o VAE decoder converte representações latentes de volta em imagens. Em autoencoders, o decoder reconstrói a entrada original a partir do gargalo comprimido. Decoders são a metade “geração” de muitas arquiteturas.

Por que importa

Todo sistema de IA generativa tem um decoder no seu núcleo. GPT, Claude e Llama são Transformers decoder-only. Stable Diffusion usa um VAE decoder para produzir imagens. Entender decoders explica por que a geração é sequencial (cada token depende dos anteriores), por que a saída é mais lenta que o processamento da entrada, e por que o paradigma autoregressivo domina a geração de texto.

Deep Dive

In a Transformer decoder, causal masking ensures each token can only attend to previous tokens (including itself). This is enforced by setting future positions to −∞ in the attention scores before softmax. The result: token 5's representation only depends on tokens 1–5. This constraint is what enables autoregressive generation — you can generate token 6 using only the representations from tokens 1–5, which are already computed.

Decoder-Only LLMs

Modern LLMs (GPT, Claude, Llama) are decoder-only: there's no separate encoder, and the entire model uses causal attention. The input prompt is processed through the same decoder layers as the generated output. This simplicity is why decoder-only won: one architecture, one attention pattern, clean scaling. The model treats everything as generation — even "understanding" the input is framed as predicting what comes next.

VAE Decoder in Image Generation

In Stable Diffusion, the diffusion process operates in a compressed latent space (64×64 instead of 512×512). The VAE decoder converts this latent representation back into a full-resolution image. It's a separate neural network that's trained to reconstruct images from latents. The quality of the VAE decoder directly affects the final image quality — a good decoder adds fine details and textures that the latent representation can't capture at its lower resolution.

Conceitos relacionados

← Todos os termos
ESC