Super résolution : Définition et signification — Wiki IA

Augmenter la résolution d'une image en générant des détails plausibles qui n'étaient pas dans l'original. Une photo de 256×256 devient une image nette de 1024×1024. La super résolution par IA ne se contente pas d'interpoler les pixels (ce qui produit du flou) — elle hallucine des textures, des bords et des détails fins réalistes basés sur ce qu'elle a appris des images haute résolution d'entraînement.

Pourquoi c'est important

La super résolution a des applications pratiques immédiates : améliorer de vieilles photos, agrandir des textures de jeux vidéo, améliorer des images de caméras de surveillance, préparer des images basse résolution pour l'impression, et comme étape de post-traitement dans les pipelines de génération d'images IA. Real-ESRGAN et des modèles similaires peuvent améliorer drastiquement la qualité d'image en une seule passe d'inférence.

En profondeur

L'upscaling classique (interpolation bilinéaire, bicubique) produit des résultats lisses et flous parce qu'il moyenne les pixels voisins. Les modèles de super résolution IA (ESRGAN, Real-ESRGAN, SwinIR) apprennent à prédire à quoi devraient ressembler les détails haute fréquence (bords nets, textures, motifs fins) à partir de l'entrée basse résolution. Ils sont entraînés sur des paires d'images haute résolution et leurs versions réduites, apprenant la correspondance de basse à haute résolution.

Le compromis de l'hallucination

L'upscaling IA invente nécessairement des détails qui ne sont pas dans l'image originale. Un visage flou reçoit des traits plausibles qui peuvent ne pas correspondre à la vraie personne. Du texte devient lisible mais peut contenir de mauvaises lettres. C'est acceptable pour l'amélioration artistique mais problématique pour les applications forensiques (images de surveillance, imagerie médicale) où les détails inventés pourraient être confondus avec de vraies preuves. Le résultat est convaincant mais pas fidèle.

Dans les pipelines de génération d'images

Beaucoup de workflows de génération d'images utilisent une approche en deux étapes : générer à une résolution plus basse (plus rapide, moins cher) puis upscaler avec un modèle de super résolution. Le « hires fix » de Stable Diffusion fait exactement ça. La génération de base gère la composition et le contenu ; l'upscaler ajoute les détails fins et la netteté. C'est plus efficace que de générer directement en haute résolution, surtout pour les modèles gourmands en calcul par pixel.