专利 基于深度自注意力变换网络的图像压缩方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111676530.4 (22)申请日 2021.12.31 (66)本国优先权数据 202111408864.3 2021.1 1.24 CN (71)申请人江苏龙源振华海洋工程有限公司地址 226000 江苏省南通市崇川区胜利路7 号龙源电力大厦申请人南京大学 (72)发明人曹春潼　施惠庆　陆明　马展　 (74)专利代理机构江苏法德东恒律师事务所 32305 专利代理师李媛媛 (51)Int.Cl. G06T 9/00(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称基于深度自注意力变换网络的图像压缩方法 (57)摘要本发明公开了一种基于深度自注意力变换网络的图像压缩方法。该方法的具体步骤如下： S1，收集和整理规范的高清图像数据集，构建神经网络训练集、测试集和交叉验证集； S2，建立多层基于深度自注意力变换的神经网络，神经网络包括编码网络和解码网络，在编码网络和解码网络中均加入深度自注意力变换模块用于特征信息聚合；训练编码网络和解码网络； S3，将图像输入编码网络得到输出数据经过量化和熵编码得到压缩的码流； S4，通过与编码网络对称的解码网络重建恢复出压缩后的图像。本发明的图像压缩方法，与传统图像压缩方法BPG在大量测试图像上的同等比较中，可以在相同质量上平均节省 20％左右的码率。权利要求书1页说明书3页附图2页 CN 114494472 A 2022.05.13 CN 114494472 A 1.基于深度自注意力变换网络的图像压缩方法，其特征在于，包括如下步骤： S1，收集和整理规范的高清图像数据集，构建神经网络训练集、测试集和交叉验证集； S2，建立多层基于深度自注意力变换的神经网络，神经网络包括编码网络和解码网络，在编码网络和解码网络中均加入深度自注意力变换模块用于特征信息聚合；训练编码网络和解码网络； S3，将图像输入编码网络得到输出数据经过量化和熵编码得到压缩的码流； S4，通过与编码网络对称的解码网络重建恢复出压缩后的图像。 2.根据权利要求1所述的基于深度自注意力变换网络的图像压缩方法，其特征在于，所述步骤S2中，所述编码网络首先采用卷积神经网络作为特征提取层，并进行特征采样，之后加入自注意力变换网络模块进行特征降采样，但最后一次特征降采样时不加入所述自注意力变换网络模块。 3.根据权利要求1所述的基于深度自注意力变换网络的图像压缩方法，其特征在于，所述步骤S2中，自注意力变换网络模块通过将特征图分为N ×N的块，计算块内像素相关性，对相关行较强的特征进行信息聚合。 4.根据权利要求3所述的基于深度自注意力变换网络的图像压缩方法，其特征在于，进行信息聚合后，再引入窗口移动机制和卷积神经网络。权　利　要　求　书 1/1 页 2 CN 114494472 A 2基于深度自注意力变换网络的图像压缩方法技术领域 [0001]本发明涉及图像编码领域，特别涉及一种基于深度自注意力变换网络的图像压缩方法。背景技术 [0002]近年来，人工神经网络发展到了深度学习(deep learning)阶段。深度学习试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法，其强大表达能力使得其在各个机器学习的任务上取到了最好的效果，在图像处理上的表现在目前也超过了其它方法。 [0003]深度学习使用了分层抽象的思想，高层的概念通过低层的概念学习得到。这一分层结构通常使用贪婪逐层训练算法构建而成，并从中选取有助于机器学习的有效特征，由于很多深度学习算法都是以无监督学习的形式出现的，因此这些算法能被应用于其他算法无法企及的无标签数据，这一类数据比有标签的数据更为丰富，也更容易获得，这一点成为深度学习的重要优势。 [0004]图像压缩在网络传输过程中的本地存储中是一个很重要的处理方法。对于那些原始图像数据，没有任何的有线网络能满足实时传输这样的内容。因此图像编码的标准化由 20世纪80年代开始，到如今技术较为成熟的JPEG， JPEG2000和BPG技术，都能在同等质量下减少更多的码率，提高传输的效率。 [0005]而由于深度学习在图像处理上的优秀表现，结合深度学习中Autoencoder的基本思路做图像压缩，用深度学习的方法来提供一个新的图像编码和解码的方法，对于图像数据压缩领域发展是一个很好的开始工作，也便于未来在图像压缩方向上，神经网络的新方案在整个系统的完善过程中有着比传统方法更好的表现和前景。 [0006]目前主流的基于深度学习的图像压缩方法都是完全基于卷积神经网络的，由于卷积神经网络本身固有的特性，例如权重固定共享，感受野扩张需要层叠卷积层，在构建编解码网络时不能有效地内容自适应，且滑动窗口机制计算开销大，对硬件设计不够友好。 [0007]深度自注意力变换网络最早用于自然语言处理任务上，近来在视觉任务例如物体检测、识别上也取得了很好的效果。借助于内容自适应相关性度量和非重叠窗口设计等，深度自注意力变换网络取得了很多优于卷积神经网络的性能结果。发明内容 [0008]针对以上现有技术，本发明的目的是结合深度学习中神经网络的方法，提出一种基于深度自注意力变换网络的图像压缩方法。 [0009]本发明采用的技术方案为： [0010]基于深度自注意力变换网络的图像压缩方法，包括如下步骤： [0011]S1，收集和整理规范的高清图像数据集，构建神经网络训练集、测试集和交叉验证集；说　明　书 1/3 页 3 CN 114494472 A 3

专利 基于深度自注意力变换网络的图像压缩方法

专利基于深度自注意力变换网络的图像压缩方法