摘要
图像是对世界上存在的自然景物的客观呈现。从传统的印刷媒体到现如今发展迅速的互联网媒体,图像也在各种不同领域之中扮演着重要角色,有着不可替代的地位。但是随着许多图像编辑工具(photoshop、Topazstudio等等)的出现,越来越多的虚假图片在各个领域传播,被精心制作的虚假图片已经达到了肉眼分辨不出的地步,图片的真实性受到了严峻的挑战。 在图像篡改检测领域,检测多种篡改类型的图像(包括拼接、复制-移动、删除)是具有难度的。现有的一些传统特征提取方法和基于卷积神经网络(CNN)的检测方法的性能并不理想,其网络提取的特征能够提供的信息是有限且单一的,对于一部分有利于图像篡改检测任务的特征没有得到很好的利用;另外,随着篡改图像类型不断增多,在检测不确定篡改类型的图像时,也存在着局部和全局特征的利用率不高和注意力机制运用具有局限性的问题。本文针对上述问题提出了两种图像篡改检测与定位的方法,主要研究内容如下: 1、基于对一部分传统方法以及基于卷积神经网络(CNN)的方法研究得知,有很多方法都存在着网络提取的特征有限且单一的特点。所以,本文提出了一个端到端的用于检测图片拼接伪造的融合非自然区域特征的环形残差U-Net。在该网络中,我们构建了一个非自然区域特征增强模块,该模块通过四个不同尺度的池化操作使非自然区域的特征得到增强,接着将这些特征与源图片特征再进行拼接后共同输入主干网络进行处理,旨在突出图片中与背景有较大差异的区域,从而使在特征提取阶段篡改区域会被给予更多注意,最终的检测结果会变得更加准确。本文在CASIA2.0、NIST16、COLUMBIA数据集上与其他一些方法相比,取得了较为优秀的性能,另外在JPEG压缩攻击和噪声破坏攻击下也能表现出较好的鲁棒性。 2、在早期和现阶段的研究中,许多方法都存在着检测篡改图像类型单一的问题,局部和全局特征的利用率不高,注意力机制存在着计算复杂度高、参数量较大、计算的空间覆盖范围有限等问题。所以,本文提出了一个跨窗口自注意力相关网络来对篡改图像进行检测和定位,并且该网络不局限于检测某一种篡改类型的图像。本文方法分为两个板块,其中一个板块用来提取图像的全局特征和局部特征,另一个板块则用来检测图像是否为被篡改图像,也会在多个尺度上对被篡改区域进行定位并输出二值掩码图。本方法充分利用了不同尺度的特征逐步生成检测的二值掩码图,并且每个检测的掩码作为下一个尺度检测掩码的先验。另外,不同尺度的特征在生成掩码之前会计算一次基于局部窗口的多头自注意力,然后再计算一次跨窗口自注意力后再生成检测的掩码,用窗口交互的方式来增加窗口之间的信息流动性,从而增加了注意力计算的空间覆盖范围,扩大了感受野,对后续的检测任务提供更多的有用信息,进一步帮助模型更好地进行检测和定位任务。在大量的实验证明下,与一些主流方法相比,该方法在三个标准数据集(CASIA2.0、NIST2016、COLUMBIA)上取得了更好的性能。此外,该算法在JPEG压缩攻击、噪声破坏攻击下都具有良好的鲁棒性。