2020 arxiv的论文,利用GAN的latent prior表示去做大尺度的SR。
之前方法的问题
1.大尺度SR是非常不固定的,需要很多信息先验
2.借助保真度loss和对抗loss的方法限制了接近自然特征的表示,从而会产生artifacts
3.借助GAN的隐层表示,但是低维表示对于恢复图像是不足够的,因此最终产生的图像会偏离保真度,而且对每个图像运行时需要大量的时间。
论文提出的点
1.借助字典表示的方法进行学习,使用预先训练好的GAN嵌入到encoder-decoder里,从而可以利用GAN的表示能力获得纹理先验,同时可以得到较好的保真度
2.将隐层特征和从encoder获取的多尺度特征进行传递,在decoder也进行多尺度传递,达到生成高保真度的效果。
3.测试时只需要一次传递,无需重复优化
论文的方法
整体框架如下所示:
1.encoder提取多尺度特征和隐层表示,多尺度特征从encoder不同level处来,隐层表示从enocder最后通过FC层得到
2.latent bank是一个预训练的Style GAN,这里将前面得到的隐层表示分成k份,分别送到latent back的不同block里,对每个block,这里同时处理encoder传递来的不同尺度feature f和隐层表示。处理得到的结果g传递到decoder。
3.不同层级的decoder接受latent bank处理的结果,在decoder里每层后加上pixel shuffle进行上采样
4.训练时,使用L2 loss和adv loss进行训练,latent bank权重固定
结果与思考
主客观结果均有明显提升,详见论文。
思考:将预训练的GAN作为prior去做高ill pose的任务,在inpainting里已经有使用,对于其他low level任务里的high ill-posed的任务也有借鉴意义。此外,除了GAN,像VQ-VAE这种生成模型,也可以考虑。