0%

读论文:Learning Texture Transformer Network for Image Super-Resolution

论文背景

图像超分的方法主要分为两类:一类是单图像超分(SISR),比如SRCNN,VDSR,RCAN等;另外一类是基于参考图像的超分方法(RefSR)。因为高分辨率图像在退化过程中会丢失很多细节和纹理信息,所以传统的单图像超分方法会产生模糊的结果;为了恢复更多的纹理信息,有研究者使用GANs来实现图像超分(SRGAN,ESRGAN等),但是GANs所带来的伪影artifacts却很难避免。 第二类方法通过Ref图像来实现图像超分取得了很好的结果,该方法通过从Ref 图像上迁移HR的纹理信息来获得视觉上可观的效果。本文的方法属于第二类,通过查询Ref 图像上合理纹理信息,将其融入到最终的超分结果。不同于以往的该类方法,本文能够有效的避免错误的纹理迁移。

方法详述

四个主要模块

如下图所示,本文提出了四个模块:可学习的纹理提取器模块(Learnable Texture Extractor), 相关性嵌入模块(Relevance Embedding),硬注意力模块(Hard Attention),软注意力模块(Soft Attention)。

image-20200808003441653

可学习的纹理提取器模块: 对于纹理信息提取,目前主流方法是使用VGG网络来提取一些浅层的特征来作为纹理信息。但是,VGG网络的训练目标是以语义为导向的图像类别标签,其高层的语义信息与低层的纹理信息有很大的差异,所以这种方式有明显的缺陷。本文提出了一种可学习的纹理提取器,其本质是一个浅层的卷积神经网络。随着训练的不断推进,该提取器不断更新自己的参数,最终可以提取到最适合超分的纹理信息,为后面的纹理迁移和纹理合成提供了很好的基础,最终生成高质量的超分结果。

注:对 Ref 图片做双三次(bicubic)下采样,再做双三次上采样,目的是为了和 LR保持域一致(即都是经过双三次变换得到的)

image-20200808004957589

相关性嵌入模块: 本文提出的纹理Transformer有Q,K,V三个要素,分别表示从低分辨率图像所提取的纹理特征信息(用来进行纹理检索),高分辨率参考图像经过先下采样再上采样得到的与低分辨率图像分布一致的图像纹理信息(用来进行纹理检索)和原参考图像的纹理信息(用来进行纹理迁移)。将Q和K分别提取特征块,然后以内积的方式计算Q和K中的特征块两两之间的相关性。内积越大表示这两个特征块之间的相关性越强,可迁移的高频纹理信息越多。反之,内积越小的地方代表这两个特征块之间的相关性越弱,可迁移的高频纹理信息就越少。该模块输出的是一个硬注意力图 H 和软注意力图 S。

image-20200808005108730

硬注意力模块: 利用硬注意力图 H 中记录的位置,从V中迁移对应位置的特征块,组合成迁移纹理特征图 T,其中 T 的每个位置包含参考图像中最相似的位置的高频纹理特征。T接着与骨干网络中的特征 F 进行级联,通过一个卷积层得到融合后的特征。

软注意力模块: 将上述融合后的特征与软注意力图进行对应位置作点乘,此时相关性强的纹理信息能够赋予相对更大的权重;相关性弱的纹理信息因为权重小而得到抑制,这样能够更好的迁移高频纹理信息的特征。

image-20200808005410271

跨尺度特征融合:

image-20200808003335200

上图将本文所提出的纹理transformer应用于x1,x2,x4三个尺度,并将不同尺度间的特征通过上采样或者带步长的卷积进行交叉融合。这样,可将参考图像的信息运用到不同的尺度,进而提高网络的特征表达能力,提高图像生成的质量。

损失函数

总的损失函数

损失函数比较常规,由重建损失+对抗损失+感知损失构成:

image-20200808003757153

重建损失使用L1 损失:

image-20200808004007973

对抗损失使用WGAN-GP:

image-20200808004017320

感知损失如下:

image-20200808003944923

实验结果

数值效果和视觉效果

image-20200808004100714

image-20200808004124347

消融实验

image-20200808004237454

总结与思考

  • 不同于我之前接触的SISR,这篇研究的是RefSR, RefSR 能有效利用来自 HR 参照图像的丰富纹理,来补充 LR 图像中缺失的细节,从而缓解不适定问题;
  • 查阅资料得知,Q (query), K(key), V (value)这些思想,最早是应用于NLP的transform中,作者将其用于图像生成任务。对于此类跨研究方向的idea迁移,以后也需多加关注。