AI实战营第二期第九节《底层视觉与MMEditing》——笔记10

阅读量：809 次

发布时间：2023-04-04

本文共 1447 字，大约阅读时间需要 4 分钟。

AI实战营第二期第九节《底层视觉与MMEditing》

什么是超分辨率

图像超分辨率是通过对低分辨率图像进行重构，恢复其高分辨率版本的技术。简单来说，就是将一张模糊或低质量的图像加倍、四倍甚至更高倍，重获清晰细节的过程。

图像分辨率的目标

提高分辨率：将低分辨率图像转化为高分辨率图像。

内容一致性：高分图像的内容应与低分图像一致。

恢复细节：重建图像的高频信息和真实内容。

传统的双线性或双立方插值方法无法有效恢复高频细节，原因在于这些方法仅进行简单的加权平均，缺乏对细节的有效重建。

超分的应用方向

超分技术已在多个领域得到了广泛应用：

经典游戏高清重制：通过超分将老旧游戏图像重构为现代设备支持的高分辨率。

动画高清重制：提升动画质感，适用于电影、电视和流媒体内容。

照片修复：修复模糊、模糊或损坏的照片。

节约高清视频传输带宽：通过降低视频分辨率传输，降低数据传输压力。

民生领域：医疗影像、卫星影像、车牌识别、空中监察等。

超分的类型

超分主要分为两类：

单图像超分：对单张图像进行处理。

视频超分：对视频帧进行逐帧超分。

单图像超分的解决思路

传统方法如稀疏编码虽然在一定程度上解决了图像超分问题，但存在以下缺点：

复杂优化问题：即使已学习出图像块的基底表示，如何分解系数仍然是一个复杂的优化问题。

高计算量：训练和推理过程耗时较长。

深度学习时代的超分算法

随着深度学习技术的发展，基于卷积神经网络（CNN）和对抗生成网络（GAN）的超分算法取得了显著进展。

基于卷积网络的模型

SRCNN：首个基于深度学习的超分算法，证明了深度学习在底层视觉的可行性。

FSRCNN：在SRCNN的基础上优化，通过直接在低分辨率图像上完成卷积运算，显著降低了计算量，适合实时应用。

基于对抗生成网络的模型

SRGAN：在SRCNN的基础上增加了判别器网络，通过对抗训练生成更细节的高分图像。

ESRGAN：通过改进网络结构、引入感知损失和对抗损失，显著提升了超分效果，获得了PIRM2018挑战赛冠军。

损失函数

超分算法的核心是定义合适的损失函数，衡量生成图像与真实图像之间的差异。常用的损失函数包括：

均方误差（MSE）：逐像素计算恢复图像与真实图像的平方误差。

感知损失：通过预训练模型计算图像的语义特征差异，衡量生成图像的内容质量。

对抗生成网络（GAN）的应用

GAN通过生成对抗训练的方式，能够更好地恢复图像的细节和真实内容。其训练过程如下：

判别器网络（D）：训练目标是最大化真实图像与生成图像的差异。

生成器网络（G）：训练目标是最小化判别器对生成图像的识别能力。

GAN的优化目标是通过对抗训练，使生成器网络能够生成更加逼真的高分图像。

视频复原任务流程

视频复原任务通常包括以下步骤：

帧对齐：通过金字塔级联变形（PCD）和形变卷积（FCD）实现帧间对齐。

语义匹配：利用时空注意力机制（TSA）和空间注意力机制（SAM）分配帧之间的像素权重。

超分和重建：对每帧进行超分处理，并进行最终的图像合成。

高质量超分模型

EDVR：一种适用于不同视频复原任务的通用框架，通过金字塔级联变形对齐和形变卷积实现高质量复原。

BasicVSR：结构简单、效果优异的超分模型，特别适用于资源受限的场景。

总结

从传统的插值方法到深度学习驱动的超分算法，图像超分技术经历了巨大的进步。随着对抗生成网络和注意力机制的引入，超分效果进一步提升，为图像处理和视频复原等领域带来了新的可能性。

转载地址：http://dbrfk.baihongyu.com/

你可能感兴趣的文章

AI实战营第二期 第九节 《底层视觉与MMEditing》