Treina um campo de velocidade ao longo de caminhos retos. Difusão usa caminhos curvos (20–50 etapas); flow matching usa caminhos mais retos (4–10 etapas). Visão unificada: ambos são modelos generativos de tempo contínuo com caminhos de probabilidade diferentes.
Modelos de difusão aprendem a reverter um processo estocástico gradual, resultando em caminhos curvos e ineficientes do ruído aos dados. Flow matching define caminhos retos (interpolações lineares), o que é mais fácil de aprender e requer menos etapas de inferência. Isso se traduz diretamente em geração mais rápida e barata.
Flux (Black Forest Labs) e Stable Diffusion 3 usam flow matching em vez de difusão pura. A tendência é clara: modelos generativos de próxima geração para imagem e vídeo estão adotando flow matching como base, mantendo qualidade comparável ou superior com custos de inferência significativamente menores.