阅读论文“CameraNet:A Two Stage Framework for Effective Camera ISP Learning”

挂在arxiv的一篇论文,将ISP过程使用网络进行学习。核心出发点是将ISP的过程根据任务相似度分成前后两个部分,即图像恢复和图像增强,在两个部分之间加入监督信号即恢复好的图像,从而引导ISP的学习。一般的ISP如下所示:

   ISP过程里不同的操作过程有不同的特性,直接简单end to end的学会非常困难。所以论文通过将不同操作步骤进行操作前后的直方图比较(详见论文)将这些步骤分成两部分,即图像恢复和图像增强两个部分。其中前者主要集中是进行线性操作,后者主要是进行非线性操作,整体pipeline和实现的网络如下所示:

图像恢复和图像增强各自实现的ISP操作如上所示,两个部分分别通过两个U-Net网络完成,其中增强部分使用基于残差连接的block,以及dialation conv和adaptive BN组成。训练时,先对两个部分分别使用L1 loss进行训练,然后联合在一起进行finetune。
   论文使用了HDR+,SID以及FiveK这三个数据集。这里看一下它们GT的获得,其中HDR+输入是raw图像,恢复的GT通过不同曝光度的HDR+图片合成得到去噪的结果,然后通过DCRaw解出,然后通过tone mapping等算法获得最终的增强GT。
SID数据集输入是短曝光的raw,GT是长曝光的raw,这里先将长曝光通过DCRaw解出恢复的GT,然后通过autoPS获得最终增强的GT。对于FiveK,输入的raw通过DCRaw解出的结果获得恢复的GT,expertC为增强的GT。该部分流程如下所示:

0%