阅读论文《Learning a Single Convolutional Super-Resolution Network for Multiple Degradations》

   这是2018CVPR一篇做超分辨的论文,主要阐述考虑多种降质因素的超分辨。
   一般的超分辨只考虑由于双线性三次插值下采样导致的高分辨退化成低分辨图像,因此当降质过程不符合该过程时,一般超分辨重建算法的效果都会比较差。本论文提出的超分辨重建算法不仅考虑由于模糊核造成的下采样,也考虑噪声造成的下采样,从而处理实际而非模型化的超分辨问题。

Method

Degradation Model

   超分辨里一般的降质模型可以表示为:

其中k表示卷积核,n表示噪声,所以该式表示模糊核模糊之后,下采样后加上噪声,下面简单讨论一下。
   对于模糊核,超分辨里的模糊核一般比较简单,就是普通的高斯模糊核,其大小和方差也是标准的。但是研究表明模糊核比图像先验的影响更大,例如当模糊核比真实的模糊核更平滑时,恢复出的图像就会过度平滑,反之恢复出的图像则会有高频振铃现象。
   对于噪声,LR图像里一般都会有噪声,直接超分辨图像会放大不想要的噪声,而直接去噪会导致丢失细节信息,恶化超分辨结果,因此去噪和超分辨要同时进行。
   对于下采样,当上述公式k是$\delta$噪声是0时,则其变为双三次退化模型。不同于模糊核和噪声在退化模型中的多样性,下采样是固定的。
   在超分辨中同时考虑模糊核和噪声是一件很有挑战性的工作,因为需要网络搜索的空间范围太大了,极有挑战性,如下图所示:

A Perspective from MAP Framework

   CNN和传统的MAP框架的目标是一致的,因此可以分析CNN和MAP框架的联系,一般的超分辨MAP问题可以表示为:

其中y是LR图像,$\sigma$是噪声水平,最后一项是正则项,k是模糊核,从上式可以看出,估计的解不仅符合降质过程,而且希望具有干净HR图像的一些特性。所以$\hat{x}$可以表示为这些参数的函数,即:

最后一个参数$\theta$表示需要估计的参数,这样就可以用CNN去表示上述判别式的学习过程。一般的超分辨重建过程仅仅只能解决与k和$\sigma$无关的判别式,因此该式实用性极强,$\lambda$参数可以包含进$\sigma$,因此上式可以表示为:

因为MAP估计的参数主要是建模图像先验知识,所以CNN可以在一个模型中解决多种退化问题。

Dimensionality Stretching

   上述公式里的y,k和$\sigma$是在不同维度的,因此需要把它们转换到同一个维度下面。这里采样的是维度拉伸的策略,这里首先将模糊核(大小pxp)拉伸为$p^2$的向量,然后使用PCA投影到t维空间,和噪声水平$\sigma$串联,变成(t+1)维的向量,再将该向量拉伸为退化图M,(大小为WH(t+1)),其中第i个退化图的元素都是相同的。如下图所示:

Proposed Network

   为了证明维度拉伸策略的有效性,仅使用简单的网络,如下所示。

   网络的输入是LR图像和退化图,中间是一系列的相同结构:Conv+BN+ReLU,后加一个单独的卷积层,最后通过一个pixel shuffle的操作进行上采样。注意,网络没有使用双三次差值后的LR图像作为输入,因为退化包含噪声,所以双三次差值LR图像会增加噪声复杂程度,从而增加网络训练难度。

Why not Learn a Blind Model?

   略

Experiments

   在不同数据集上和使用不同的降噪模型,其均有不错的效果(表略),且对于实际的超分辨问题,其重建的图像感官也更好。

0%