超解析度：定義與含義 — AI 維基

透過生成原始圖像中不存在的合理細節來提高圖像解析度。一張 256×256 的照片變成清晰的 1024×1024 圖像。AI 超解析度不只是簡單的像素插值（那只會產生模糊）——它會基於從高解析度訓練圖像中學到的知識，幻想出逼真的紋理、邊緣和精細細節。

為什麼重要

超解析度具有直接的實用價值：增強老照片、升頻遊戲貼圖、改善監視器畫面、為低解析度圖片準備列印輸出，以及作為 AI 圖像生成流程中的後處理步驟。Real-ESRGAN 等模型可以在單次推論中大幅提升圖像品質。

傳統升頻（雙線性、雙三次插值）會產生平滑模糊的結果，因為它對相鄰像素取平均。AI 超解析度模型（ESRGAN、Real-ESRGAN、SwinIR）學習預測低解析度輸入應有的高頻細節（銳利邊緣、紋理、精細紋樣）。它們在高解析度圖像與其降頻版本的配對上進行訓練，學習從低解析度到高解析度的映射。

AI 升頻必然會發明原始圖像中不存在的細節。模糊的人臉會獲得看似合理的特徵，但這些特徵可能與真實的人不符。文字變得可讀，但可能包含錯誤的字母。這對藝術增強來說沒問題，但對鑑識應用（監視器畫面、醫學影像）來說就有問題了，因為發明出來的細節可能被誤認為真實證據。輸出看起來令人信服，但並不忠實。

許多圖像生成工作流程採用兩階段方法：先以較低解析度生成（更快、更便宜），然後用超解析度模型升頻。Stable Diffusion 的「hires fix」就是這麼做的。基礎生成處理構圖和內容；升頻器添加精細細節和銳度。這比直接以高解析度生成更有效率，特別是對於每個像素計算量大的模型。