传统放大(双线性、双三次插值)通过对相邻像素取平均产生平滑模糊的结果。AI超分辨率模型(ESRGAN、Real-ESRGAN、SwinIR)学习预测高频细节(锐利边缘、纹理、精细图案)在给定低分辨率输入时应该是什么样的。它们在高分辨率图像及其降采样版本的配对上训练,学习从低分辨率到高分辨率的映射。
AI放大必然会发明原始图像中不存在的细节。模糊的人脸会获得看起来合理但可能与真人不符的特征。文字变得可读但可能包含错误的字母。这对于艺术增强来说没问题,但在取证应用(监控录像、医学影像)中有问题,因为虚构的细节可能被误认为真实证据。输出看起来令人信服,但并不忠实。
许多图像生成工作流采用两阶段方法:先以较低分辨率生成(更快、更便宜),然后用超分辨率模型放大。Stable Diffusion的“hires fix”就是这样做的。基础生成处理构图和内容;放大器添加精细细节和锐度。这比直接在高分辨率下生成更高效,尤其是对于每像素计算密集的模型。