团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111676530.4 (22)申请日 2021.12.31 (66)本国优先权数据 202111408864.3 2021.1 1.24 CN (71)申请人 江苏龙源振华海洋工程有限公司 地址 226000 江苏省南 通市崇川区胜利路7 号龙源电力大厦 申请人 南京大学 (72)发明人 曹春潼 施惠庆 陆明 马展  (74)专利代理 机构 江苏法德东恒律师事务所 32305 专利代理师 李媛媛 (51)Int.Cl. G06T 9/00(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于深度自注意力变换网络的图像压缩方 法 (57)摘要 本发明公开了一种基于深度自注意力变换 网络的图像压缩方法。 该方法的具体步骤如下: S1, 收集和整理规范的高清图像数据集, 构建神 经网络训练集、 测试集和交叉验证集; S2, 建立多 层基于深度自注意力变换的神经网络, 神经网络 包括编码网络和解码网络, 在编码网络和解码网 络中均加入深度自注意力变换模块用于特征信 息聚合; 训练编码网络和解码网络; S3, 将图像输 入编码网络得到输出数据经过量化和熵编码得 到压缩的码流; S4, 通过与编码网络对称的解码 网络重建恢复出压缩后的图像。 本发 明的图像压 缩方法, 与传统图像压缩方法BPG在大量测试图 像上的同等比较中, 可以在相同质量上平均节省 20%左右的码率。 权利要求书1页 说明书3页 附图2页 CN 114494472 A 2022.05.13 CN 114494472 A 1.基于深度自注意力变换网络的图像压缩方法, 其特 征在于, 包括如下步骤: S1, 收集和整理规范的高清图像数据集, 构建神经网络训练集、 测试集和交叉验证集; S2, 建立多层基于深度自注意力变换的神经网络, 神经网络包括编码网络和解码网络, 在编码网络和解码网络中均加入深度自注意力变换模块用于特征信息聚合; 训练编 码网络 和解码网络; S3, 将图像输入编码网络得到 输出数据经过量化和熵编码得到 压缩的码流; S4, 通过与编码网络对称的解码网络 重建恢复出压缩后的图像。 2.根据权利要求1所述的基于深度自注意力变换网络的图像压缩方法, 其特征在于, 所 述步骤S2中, 所述编码网络首先采用卷积神经网络作为特征提取层, 并进 行特征采样, 之后 加入自注意力变换网络模块进 行特征降采样, 但 最后一次特征降采样时不加入所述自注意 力变换网络模块。 3.根据权利要求1所述的基于深度自注意力变换网络的图像压缩方法, 其特征在于, 所 述步骤S2中, 自注意力变换网络模块通过将特征图分为N ×N的块, 计算块内像素相关性, 对 相关行较强的特 征进行信息聚合。 4.根据权利要求3所述的基于深度自注意力变换网络的图像压缩方法, 其特征在于, 进 行信息聚合后, 再引入窗口移动机制和卷积神经网络 。权 利 要 求 书 1/1 页 2 CN 114494472 A 2基于深度自注意力变换网 络的图像压缩方 法 技术领域 [0001]本发明涉及图像编码领域, 特别涉及一种基于深度自注意力变换网络的图像压缩 方法。 背景技术 [0002]近年来, 人工神经网络 发展到了深度学习(deep  learning)阶段。 深度学习试图使 用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算 法, 其强大表达能力使得其在各个机器学习的任务上取到了最好的效果, 在图像处理上 的 表现在目前也超过了其它方法。 [0003]深度学习使用了分层抽象的思想, 高层的概念通过低层的概念学习得到。 这一分 层结构通常使用贪婪逐层训练算法构建而成, 并从中选取有助于机器学习的有效特征, 由 于很多深度学习算法都是以无监督学习的形式出现的, 因此这些算法能被应用于其他算法 无法企及的无标签数据, 这一类数据比有 标签的数据更为丰富, 也更容易 获得, 这一点 成为 深度学习的重要优势。 [0004]图像压缩在网络传输过程中的本地存储中是一个很重要的处理方法。 对于那些原 始图像数据, 没有任何的有线网络能满足实时传输这样的内容。 因此图像编码的标准化由 20世纪80年代开始, 到如今技术较为成熟的JPEG, JPEG2000和BPG技术, 都能在同等质量下 减少更多的码率, 提高传输的效率。 [0005]而由于深度学习在图像处理上的优秀表现, 结合深度学习中Autoencoder的基本 思路做图像压缩, 用深度学习的方法来提供一个新的图像编码和 解码的方法, 对于图像数 据压缩领域发展是一个很好的开始工作, 也便于未来在图像压缩方向上, 神经网络的新方 案在整个系统的完 善过程中有着比传统方法更好的表现和前 景。 [0006]目前主流的基于深度学习的图像压缩方法都是完全基于卷积神经网络的, 由于卷 积神经网络本身固有的特性, 例如权重固定共享, 感受野扩张需要层叠卷积层, 在构建编解 码网络时不能有效地内容自适应, 且滑动窗口机制计算 开销大, 对硬件设计不够友好。 [0007]深度自注意力变换网络最早用于自然语言处理任务上, 近来在视觉任务例如物体 检测、 识别上也取得了很好的效果。 借助于内容自适应相关性度量和非重叠窗口设计等, 深 度自注意力变换网络取 得了很多优于卷积神经网络的性能结果。 发明内容 [0008]针对以上现有技术, 本发明的目的是结合深度学习中神经网络 的方法, 提出一种 基于深度自注意力变换网络的图像压缩方法。 [0009]本发明采用的技 术方案为: [0010]基于深度自注意力变换网络的图像压缩方法, 包括如下步骤: [0011]S1, 收集和整理规范的高清图像数据集, 构建神经 网络训练集、 测试集和交叉验证 集;说 明 书 1/3 页 3 CN 114494472 A 3

.PDF文档 专利 基于深度自注意力变换网络的图像压缩方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度自注意力变换网络的图像压缩方法 第 1 页 专利 基于深度自注意力变换网络的图像压缩方法 第 2 页 专利 基于深度自注意力变换网络的图像压缩方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:50:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。