阅读论文《SID NISM:A Self-supervised Low-light Image Enhancement Framework》

   2020挂在arxiv的一篇论文,自监督低光照增强

现有方法的问题

1.需要成对的数据
2.传统的基于Retinex的方法会产生不好的artifacts

论文提出的点

1.对于输入图像使用Retinex进行分解,使用其直方图增强的结果作为辅助,最终分解成光照无关的反射图,有结构信息的光照图和与反射图相关的噪声图。
2.对于光照图使用非线性变换增强NISM,从而在增强整张图的情况下保留对比度。

论文的方法

如下图所示:

自监督分解网络SID-Net

1.这里加入直方图均衡化的结果作为中间的辅助变量也用来分解,而并不是使用GT,个人认为是为了增强分解时的鲁棒性。
2.损失函数为$L = \lambda{rc}L{rc}+\Sigma{i=low,he}(L^i{rec}+\lambda{L}L^i{L}+\lambda{R}L^i{R}+\lambda{N}L^i{N})$,其中第一项约束直方图增强后结果he和输入I,后面对he和I分别对光照图反射图和噪声图进行约束,以及重建损失。
3.重建损失函数为$L{rec}=||R\cdot L+N-S||_1$
4.反射图一致损失为$L
{rc} = ||R{low}-R{he}||1$
5.光照图损失函数包括两项,前者使得光照图在平滑的同时和反射图在整体结构上保持一致,后者则类似于WLS损失,保留光照图中大的edge,抑制小的edge,其为$L_L = ||\triangledown L \cdot exp(-\alpha \triangledown R)||_1+||\triangledown L \cdot exp(-\alpha \Sigma
{j=low,he} \triangledown Lj||_1$
6.对于反射图,这里也包括两项,为$L_R = \frac{1}{3} \Sigma
{ch = R,G,B}|| \triangledown R^{ch} - \beta \triangledown S^{ch}||_F+||R^H-S^H||_2$,其中第一项为让反射图的梯度是输入图S梯度的$\beta$倍,从而增强对比度,后者使得反射图和输入图色度一致,从而避免色偏。
7.对于噪声图,重建损失去除R和L的部分就是N,由于越暗的地方噪声越多,这里需要对噪声图N进行约束,为$L_N = ||S \cdot N||_F$

非线性变换增强NISM

1.伽马变换会导致暗区域过曝,而亮区域几乎没被改变(虽然亮区本来就不需要太大变化),导致对比度失调。
2.对于暗区域,增强的程度可以更低一点,而对于亮区域,增强的程度应当更大,从而使得最终增强的结果足够亮
3.使用NISM,则变化曲线表示为$\hat{L}=1-(1-L)^{\lambda}$,当$\lambda$值为2.2时,其和伽马变换的曲线如下所示,可以看出,和2的分析是吻合的

4.实际中,$\lambda$的值则是根据亮暗区域的阈值T确定的,公式为$\lambda = log(1-0.8)/(1-T)$

实验与结果

1.可以在几百个迭代内对一张图实现训练(比传统方法慢太多了吧?)
2.实验结果对比略
3.思考,论文亮点是引入直方图增强结果,其实是增强了训练的鲁棒性,引入额外数据辅助自监督是一个思路;此外,对于光照图的处理,也可以有更好的变换方式。

0%