团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111653638.1 (22)申请日 2021.12.3 0 (71)申请人 上海壁仞智能科技有限公司 地址 201100 上海市闵行区陈行公路238 8 号16幢13层13 02室 (72)发明人 不公告发明人 (74)专利代理 机构 北京市柳沈 律师事务所 11105 代理人 彭久云 罗莎 (51)Int.Cl. G06T 5/00(2006.01) G06T 9/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像处理方法、 图像处 理装置和存 储介质 (57)摘要 一种图像处理方法、 图像处理装置和计算机 可读存储介质。 图像处理方法包括: 获取输入 图 像; 利用图像重建网络对输入图像进行N次重建 操作, 以得到输入图像对应的重建图像。 图像重 建网络包括编码子网络、 解码 子网络和连接子网 络, 编码子网络包括至少一个编码块, 每个编码 块包括多个自注意力算子, 解码 子网络包括至少 一个解码块, 每个解码块包括多个自注意力算 子, 连接子网络包括连接层, 一个编码块与一个 解码块通过连接层映射连接。 每次重建操作包 括: 通过编码子网络对编码子网络的输入进行特 征提取处理, 以得到第一特征图和至少一个编码 块的输出; 利用解码子网络和连接子网络对第一 特征图和至少一个编码块的输出进行处理, 以得 到解码子网络的输出。 权利要求书5页 说明书25页 附图6页 CN 114359092 A 2022.04.15 CN 114359092 A 1.一种图像处 理方法, 包括: 获取输入图像; 利用图像重建网络对所述输入图像进行N次重建操作, 以得到所述输入图像对应的重 建图像, 其中, N为大于等于1的正整数, 所述图像重建网络包括编码子网络、 解码子网络和连接 子网络, 所述编码子网络包括至少一个编码块, 每 个编码块包括多个自注意力算子, 所述解码子网络包括至少一个解码块, 每 个解码块包括多个自注意力算子, 所述连接 子网络包括连接层, 所述至少一个编码块中的一个编码块与所述至少一个解码块中的一个解码块通过所 述连接层映射连接, 其中, 每次重建操作包括: 通过所述编码子网络对所述编码子网络的输入进行特征提取处理, 以得到第 一特征图 和所述至少一个编码块的输出; 利用所述解码子网络和所述连接子网络对所述第一特征图和所述至少一个编码块的 输出进行处 理, 以得到所述 解码子网络的输出。 2.根据权利要求1所述的图像处 理方法, 其中, 所述图像重建网络还 包括瓶颈层, 其中, 在所述图像重建网络包括所述 瓶颈层的情况 下, 每次重建操作包括: 通过所述编码子网络对所述编码子网络的输入进行特征提取处理, 以得到所述第 一特 征图和所述至少一个编码块的输出; 利用所述 瓶颈层对所述第一特 征图进行处 理, 以得到第二特 征图; 利用所述解码子网络和所述连接子网络对所述第二特征图和所述至少一个编码块的 输出进行处 理, 以得到所述 解码子网络的输出。 3.根据权利要求2所述的图像处 理方法, 其中, 所述 瓶颈层包括多个自注意力算子, 利用所述 瓶颈层对所述第一特 征图进行处 理, 以得到第二特 征图, 包括: 利用所述瓶颈层的多个自注意力算子对所述第 一特征图进行表示学习, 以得到所述第 二特征图。 4.根据权利要求3所述的图像处理方法, 其中, 所述瓶颈层的多个自注意力算子包括依 次交替连接的基于窗口 的自注意力算子和基于移动窗口 的自注意力算子, 所述瓶颈层中的基于窗口的自注意力算子的数量比基于移动 窗口的自注意力算子的 数量多1。 5.根据权利要求1 ‑4中任一项所述的图像处 理方法, 其中, 当N为1, 对于所述N次重建操作, 所述编码子网络的输入为所述输入图像, 所述解码子 网络的输出为所述重建图像, 当N大于1, 对所述N次重建操作中的第i次重建操作中所述解码子网络的输出进行数据 拟合处理和数据修正处理, 以得到所述N次重 建操作中的第i +1次重建操作中所述编码子网 络的输入, i 为正整数且小于N, i为1时, 所述第i次重建操作中所述编码子网络的输入为所述输入图像, i为N ‑1时, 所 述第i+1次重建操作中所述 解码子网络的输出为所述重建图像。权 利 要 求 书 1/5 页 2 CN 114359092 A 26.根据权利要求2 ‑4中任一项所述的图像处理方法, 其中, 所述连接子网络包括至少一 个连接层, 所述至少一个编 码块与所述至少一个解码块通过所述至少一个连接层一一对应 映射连接, 每个所述连接层用于将具有相同尺寸特 征的编码块和解码块进行映射连接 。 7.根据权利要求1 ‑4中任一项所述的图像处理方法, 其中, 所述解码子网络还包括线性 投影层, 所述至少一个编码块包括依 次连接的多个编码块, 所述至少一个解码块包括依 次 连接的多个解码块, 所述连接 子网络包括多个连接层, 所述多个编码块与所述多个解码块 通过所述多个连接层一 一对应映射连接, 每个所述连接层用于将所述连接层对应的编码块的输出和所述连接层对应的解码块 的输出进行 连接处理, 所述连接层的输出作为所述连接层对应的解码块所连接的下一个解码块的输入或者 所述连接层的输出作为所述线性投影层的输入。 8.根据权利要求1 ‑4中任一项所述的图像处理方法, 其中, 所述编码子网络还包括输出 编码块, 所述至少一个编码块包括输入编码块, 通过所述编码子网络对所述编码子网络的输入进行特征提取处理, 以得到第 一特征图 和所述至少一个编码块的输出, 包括: 通过所述输入编码块对所述编码子网络的输入进行处理, 以得到所述输入编码块的输 出; 利用所述输出编码块对所述输入编码块的输出进行处 理, 以得到所述第一特 征图。 9.根据权利要求8所述的图像处理方法, 其中, 所述输出编码块包括多个自注意力算子 和补丁合并层, 利用所述输出编码块对所述输入编码块的输出进行处理, 以得到所述第一特征图, 包 括: 通过所述输出编码块中的补丁合并层对所述输入编码块的输出进行下采样操作和第 一通道数调整操作, 以得到第一编码特 征图; 通过所述输出编码块中的多个自注意力算子对所述第 一编码特征图进行表示学习, 以 得到所述第一特 征图。 10.根据权利要求9所述的图像处理方法, 其中, 所述补丁合并层包括下采样层和第一 线性层, 所述下采样层用于执行所述下采样操作, 所述第一线性层用于执行所述第一通道 数调整操作; 通过所述输出编码块中的补丁合并层对所述输入编码块的输出进行下采样操作和第 一通道数调整操作, 以得到第一编码特 征图, 包括: 通过所述下采样层对所述输入编码块的输出进行所述下采样操作, 以得到所述下采样 层的输出; 通过所述第 一线性层对所述下采样层的输出进行所述第 一通道数调 整操作, 以得到所 述第一编码特 征图。 11.根据权利要求9所述的图像处理方法, 其中, 所述第一编码特征图的维度和所述第 一特征图的维度相同, 所述第一编码特 征图的尺寸和所述第一特 征图的尺寸相同。 12.根据权利要求1 ‑4中任一项所述的图像处理方法, 其中, 所述至少一个编码块包括权 利 要 求 书 2/5 页 3 CN 114359092 A 3
专利 图像处理方法、图像处理装置和存储介质
文档预览
中文文档
37 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共37页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:49:39
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
SY-T 6662.2-2020 石油天然气工业用非金属复合管 第2部分:柔性复合高压输送管.pdf
AI大模型将彻底改变智能汽车产业-2023-11-智能网联.pdf
GB-T 35229-2017 地面气象观测规范 雪深与雪压.pdf
GB-T 24936-2010 全地形车 术语.pdf
T-CFA 020101161—2020 铸造高速钢轧辊.pdf
DB4106-T 32-2020 公共机构既有建筑节能改造管理规范 鹤壁市.pdf
GB-T 40224-2021 雨水渗透、调蓄、储存用塑料模块.pdf
DB31-T 1240.1-2020 公共数据共享交换工作规范 第1部分:平台建设和运行管理要求 上海市.pdf
T-ACEF 034—2022 城镇供水管网数字化技术指南.pdf
GB-T 26333-2010 工业控制网络安全风险评估规范.pdf
GB/T 32925-2016 信息安全技术 政府联网计算机终端安全管理基本要求.pdf
GB-T 22336-2008 企业节能标准体系编制通则.pdf
T-ZJBE 002—2023 电动自行车充换电消防安全技术要求.pdf
GB-T 13575.1-2022 普通和窄V带传动 第1部分:基准宽度制.pdf
GB-T 34690.8-2017 印刷技术 胶印数字化过程控制 第8部分:胶印设备.pdf
GB-T 19472.2-2017 埋地用聚乙烯 PE 结构壁管道系统 第2部分:聚乙烯缠绕结构壁管材.pdf
T-CAMETA 001006.3—2022 工业网关 第3部分:面向数控系统的工业网关测评技术规范.pdf
DB5223-T 28-2021 新市民残疾人大学生教育资助基本公共服务规范 黔西南布依族苗族自治州.pdf
GB-T 37955-2019 信息安全技术 数控网络安全技术要求.pdf
数据安全审计制度.pdf
1
/
3
37
评价文档
赞助2元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。