Zubnet AIApprendreWiki › Super Resolution
Using AI

Super Resolution

Upscaling, Image Enhancement, SR
Augmenter la résolution d'une image en générant des détails plausibles qui n'étaient pas dans l'original. Une photo 256×256 devient une image nette 1024×1024. La super resolution IA n'interpole pas juste des pixels (ce qui produit du flou) — elle hallucine de la texture réaliste, des contours et des détails fins basés sur ce qu'elle a appris d'images d'entraînement haute résolution.

Pourquoi c'est important

La super resolution a des applications pratiques immédiates : améliorer de vieilles photos, upscaler des textures de jeux vidéo, améliorer le footage de caméras de sécurité, préparer des images basse résolution pour l'impression, et comme étape de post-traitement dans les pipelines de génération d'images IA. Real-ESRGAN et des modèles similaires peuvent dramatiquement améliorer la qualité d'image en une seule passe d'inférence.

Deep Dive

Classical upscaling (bilinear, bicubic interpolation) produces smooth, blurry results because it averages neighboring pixels. AI super resolution models (ESRGAN, Real-ESRGAN, SwinIR) learn to predict what high-frequency detail (sharp edges, textures, fine patterns) should look like given the low-resolution input. They're trained on pairs of high-res images and their downscaled versions, learning the mapping from low to high resolution.

The Hallucination Trade-off

AI upscaling necessarily invents detail that isn't in the original image. A blurry face gets plausible-looking features that may not match the actual person. Text becomes readable but may contain wrong letters. This is fine for artistic enhancement but problematic for forensic applications (security footage, medical imaging) where invented detail could be mistaken for real evidence. The output looks convincing but isn't faithful.

In Image Generation Pipelines

Many image generation workflows use a two-stage approach: generate at a lower resolution (faster, cheaper) then upscale with a super resolution model. Stable Diffusion's "hires fix" does exactly this. The base generation handles composition and content; the upscaler adds fine detail and sharpness. This is more efficient than generating at high resolution directly, especially for models that are compute-intensive per pixel.

Concepts liés

← Tous les termes
ESC