阅读论文《Learned Perceptual Image Enhancement》

   2018 ICCP的一篇论文,感觉也是在排列组合,这里简要理解一下。
   论文的核心思想是将图像主观质量评价引入进来,作为一种loss帮助图像增强。因此这里增强的loss分为两类,一个是保真项,一个是感知损失,表示如下:

   其中第一项是保真项,第二项是基于美学质量评价器的损失,该评价器称为NIMA,第二项表示为:

   其中NIMA结构图表示如下:

   这里因为GT是十个类别,所以其输出也是十类。它的目标是预测输出的分布,其使用的是基于EMD的loss,其主要惩罚类间错误分类,分类器的输出实际是分到每类的概率值,所以使得这个分布和真实分布接近,loss实际使用的是预测和真实的累计概率分布的差值。测试时输出结果是各个分数值和概率值的加权和,原理很好理解。增强网络使用的是CAN,其他部分见论文。

0%