团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111650415.X (22)申请日 2021.12.3 0 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 赵玲玲 (74)专利代理 机构 北京曼威知识产权代理有限 公司 11709 代理人 邓超 (51)Int.Cl. G06V 30/412(2022.01) G06V 30/414(2022.01) G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种模型训练以及表格识别方法及装置 (57)摘要 本说明书公开了一种模型训练以及表格识 别方法及装置, 确定若干包含表格的图像, 作为 各训练样本, 针对每个训练样本, 根据该训练样 本中表格的结构和位置, 确定该训练样本的标 注, 将该训练样本输入识别模型的特征提取层, 确定该训练样本对应的 图像特征金字塔, 针对图 像特征金字塔中的每张特征图, 确定该特征图对 应的重构编码, 并对该特征图对应的重构编码进 行上采样, 与尺寸大于该特征图的其他特征图进 行融合, 将各特征图对应的融合结果作为输入, 输入识别模 型的识别层, 得到该训练样本的识别 结果。 本方法基于不同尺寸的特征图进行融合, 确定训练样 本的识别结果, 获取到的图像特征更 加全面, 在识别采集到的图像时可 获取到丰富的 信息量, 效率较高。 权利要求书2页 说明书12页 附图5页 CN 114359935 A 2022.04.15 CN 114359935 A 1.一种识别模型的训练方法, 其特 征在于, 包括: 确定若干包含表格的图像, 作为各训练样本, 针对每个训练样本, 根据 该训练样本 中表 格的结构和位置, 确定该训练样本的标注; 将该训练样本作为输入, 输入到待训练的识别模型的特征提取层, 对该训练样本分别 进行上采样和下采样, 确定该训练样本对应的图像特 征金字塔; 针对所述图像特征金字塔中的每张特征图, 对该特征图进行不同方向的卷积, 确定该 特征图对应的重构编码, 并对该特征图对应的重构编码进行上采样, 与所述图像特征金字 塔中尺寸大于该 特征图的其 他特征图进行融合, 确定融合结果; 将各特征图对应的融合结果作为输入, 输入所述识别模型的识别层, 得到所述识别层 输出的该训练样本的识别结果; 根据各训练样本的识别结果及其标注, 对所述识别模型进行训练。 2.如权利要求1所述的方法, 其特 征在于, 所述识别结果包 含多种类型; 根据各训练样本的识别结果及其标注, 对所述识别模型进行训练, 具体包括: 针对每个训练样本, 根据预设的识别结果的类型和该训练样本的标注, 确定该训练样 本对应于各类型的标注; 根据各训练样本分别对应的所述各类型的识别结果和标注, 确定损 失, 并根据所述损 失调整所述识别模型的模型参数。 3.如权利要求1所述的方法, 其特征在于, 将各特征图对应的融合结果作为输入, 输入 所述识别模型的识别层, 得到所述识别层输出的该训练样本的识别结果, 具体包括: 将各特征图对应的融合结果作为输入, 输入所述识别模型的识别层的卷积子层, 确定 各特征图对应的相同尺寸的融合结果; 将各特征图对应的相同尺寸的融合结果输入所述识别模型的识别层的融合子层, 得到 该训练样本 输出的识别结果。 4.如权利要求1所述的方法, 其特征在于, 对该特征图对应的重构编码进行上采样, 与 所述图像特征金字塔中尺寸大于该特征图的其他特征图进行融合, 确定融合结果, 具体包 括: 针对所述图像特征金字塔中的每张特征图, 将该特征图对应的重构编码进行上采样, 与尺寸大于该 特征图的尺寸 一个层级的特 征图进行融合, 确定融合结果。 5.如权利要求3所述的方法, 其特征在于, 所述识别结果包含二十九种类型, 所述识别 层为二十九通道的卷积神经网络层, 其中, 五层用于语义分割, 二十四层用于像素分类; 将各特征图对应的相同尺寸的融合结果输入所述识别模型的识别层的融合子层, 得到 该训练样本 输出的识别结果, 具体包括: 将各特征图对应的相同尺寸的融合结果输入所述识别模型的识别层的融合子层, 确定 该训练样本对应的融合特 征; 根据预设的识别结果的类型和所述融合特征, 得到预设的各通道输出的该训练样本的 识别结果。 6.一种表格识别方法, 其特 征在于, 包括: 确定包含表格的图像; 将所述图像作为输入, 输入预先训练好的识别模型的特征提取层, 对所述图像分别进权 利 要 求 书 1/2 页 2 CN 114359935 A 2行上采样和下采样, 确定所述图像对应的图像特 征金字塔; 针对所述图像特征金字塔中的每张特征图, 对该特征图进行不同方向的卷积, 确定该 特征图对应的重构编码, 并对该特征图对应的重构编码进行上采样, 与所述图像特征金字 塔中尺寸大于该 特征图的其 他特征图进行融合, 确定融合结果; 将各特征图对应的融合结果作为输入, 输入所述识别模型的识别层, 得到所述识别层 输出的所述图像的识别结果, 根据所述图像的识别结果, 确定所述图像中表格的结构及位 置。 7.一种识别模型的训练装置, 其特 征在于, 包括: 样本确定模块, 用于确定若干包含表格的图像, 作为各训练样本, 针对每个训练样本, 根据该训练样本中表格的结构和位置, 确定该训练样本的标注; 采样模块, 用于将该训练样本作为输入, 输入到待训练的识别模型的特征提取层, 对该 训练样本分别进行 上采样和下采样, 确定该训练样本对应的图像特 征金字塔; 融合模块, 用于针对所述图像特征金字塔中的每张特征图, 对该特征图进行不同方向 的卷积, 确定该特征图对应的重构编码, 并对该特征图对应的重构编 码进行上采样, 与所述 图像特征金字塔中尺寸大于该 特征图的其 他特征图进行融合, 确定融合结果; 识别模块, 用于将各特征图对应的融合结果作为输入, 输入所述识别模型的识别层, 得 到所述识别层输出的该训练样本的识别结果; 训练模块, 用于根据各训练样本的识别结果及其标注, 对所述识别模型进行训练。 8.一种表格识别装置, 其特 征在于, 包括: 第一确定模块, 用于确定包 含表格的图像; 第二确定模块, 用于将所述图像作为输入, 输入预先训练好的识别 模型的特征提取层, 对所述图像分别进行 上采样和下采样, 确定所述图像对应的图像特 征金字塔; 融合模块, 用于针对所述图像特征金字塔中的每张特征图, 对该特征图进行不同方向 的卷积, 确定该特征图对应的重构编码, 并对该特征图对应的重构编 码进行上采样, 与所述 图像特征金字塔中尺寸大于该 特征图的其 他特征图进行融合, 确定融合结果; 第三确定模块, 用于将各特征图对应的融合结果作为输入, 输入所述识别模型的识别 层, 得到所述识别 层输出的所述图像的识别结果, 根据所述图像的识别结果, 确定所述图像 中表格的结构及位置 。 9.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算 机程序被处 理器执行时实现上述权利要求1~5或权利要求6任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现上述权利要求 1~5或权利要求6任一 项所述的方法。权 利 要 求 书 2/2 页 3 CN 114359935 A 3
专利 一种模型训练以及表格识别方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:48:31
上传分享
举报
下载
原文档
(755.0 KB)
分享
友情链接
思度安全-DSMM-022 数据供应链安全管理规范V1.0.pdf
GM-T 0077-2019 银行核心信息系统密码应用技术要求.pdf
T-ZYLM 0003—2023 昌吉玉米种子 制种玉米种子加工技术规程.pdf
GB-T 1871.5-2022 磷矿石和磷精矿中氧化镁含量的测定 火焰原子吸收光谱法、容量法和电感耦合等离子体发射光谱法.pdf
YD-T 3813-2020 基础电信企业数据分类分级方法.pdf
GB-T 34079.5-2021 基于云计算的电子政务公共平台服务规范 第5部分:移动服务.pdf
中国电信 云网运营自智白皮书 2022.pdf
GB-T 6003.2-2012 试验筛 技术要求和检验 第2部分:金属穿孔板试验筛.pdf
华东政法大学 人工智能通用大模型(ChatGPT)的进展 风险与应对 2023.pdf
GB-T 39853.1-2021 供电系统中的电能质量测量 第1部分:电能质量监测设备(PQI).pdf
GA-T 460.4-2020 居民身份证卡体材料及打印薄膜技术规范 第4部分:制卡用模块、线圈承载层白色PETG薄膜.pdf
GB-T 19715.2-2005 信息技术信息技术安全管理指南第2部分:管理和规划信息技术安全.pdf
HB 8574-2020 民用飞机机载嵌入式操作系统应用集成验证要求.pdf
GB-T 33647-2017 车用汽油中硅含量的测定 电感耦合等离子体发射光谱法.pdf
GB-T 37606-2019 钛-钢复合管.pdf
tc260 人工智能安全标准化白皮书 2019.pdf
YD-T 3979-2021 数据中心浸没式液冷服务器系统技术要求和测试方法.pdf
T-CECS G:D60-02—2023 公路超高性能混凝土 UHPC 桥梁技术规程.pdf
GB-T 11835-2016 绝热用岩棉、矿渣棉及其制品.pdf
DB3301-T 0385—2022 大学生创业园服务规范 杭州市.pdf
1
/
3
20
评价文档
赞助2元 点击下载(755.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。