团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111647046.9 (22)申请日 2021.12.3 0 (71)申请人 河南职业 技术学院 地址 450000 河南省郑州市郑东 新区龙子 湖高校园区平安大道 210号 (72)发明人 窦雪霞 田华 姜梦园 徐晓阳  王一璠 李云鹤 韩娜  (74)专利代理 机构 郑州芝麻知识产权代理事务 所(普通合伙) 41173 代理人 李琼 (51)Int.Cl. G06V 20/62(2022.01) G06V 10/74(2022.01) G06V 10/762(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于人工智能的定额发票识别准确度评价 方法及系统 (57)摘要 本发明涉及人工智能技术领域, 具体涉及基 于人工智能的定额发票识别准确度评价方法及 系统。 该方法包括: 采集定额发票的发票图像, 在 发票图像中提取发票包围框; 在发票包围框内提 取发票的文本信息, 构成高维向量; 对每两张发 票图像对应的高维向量计算信息一致性, 并依据 信息一致性获取每两张发票图像之间的样本距 离; 根据样本距离将发票图像进行密度聚类, 分 为多个类别; 获取每张发票图像与同类别其他发 票图像之间的信息差异, 进而得到该发票图像的 容错率; 依据每个类别的所有发票图像的容错率 均值获取该类别的容错系数; 根据每张发票图像 对应的容错系数以及信息差异获取该发票图像 的识别准确度。 本发明实施例能够降低定额发票 录入错误的概率。 权利要求书1页 说明书6页 附图1页 CN 114299485 A 2022.04.08 CN 114299485 A 1.基于人工智能的定额发票识别准确度评价方法, 其特 征在于, 该 方法包括以下步骤: 采集定额发票的发票图像, 在所述发票图像中提取发票包围框; 在所述发票包围框内 提取发票的文本信息, 构成高维向量; 对每两张所述发票图像对应的所述高维向量计算信 息一致性, 并依据 所述信息一致性 获取每两张发票图像之间的样本距离; 根据所述样本距离将所述发票图像进行密度聚类, 分为多个 类别; 获取每张发票图像与同类别其他发票图像之间的信 息差异, 进而得到该发票图像的容 错率; 依据每 个类别的所有发票图像的容 错率均值获取 该类别的容 错系数; 根据每张发票图像对应的容 错系数以及所述信息 差异获取 该发票图像的识别准确度。 2.根据权利要求1所述的方法, 其特 征在于, 所述高维向量的构建过程 为: 截取所述发票包围框的区域, 对其进行扫描, 得到发票图像中各个关键参数的内容, 构 成所述高维向量; 所述关键参数至少包括发票尺寸、 发票类型、 发票代码和金额。 3.根据权利要求2所述的方法, 其特 征在于, 所述发票尺寸的获取 过程为: 根据所述发票包围框的区域在所述发票图像中的面积占比以及图像采集参数获取所 述发票尺寸。 4.根据权利要求1所述的方法, 其特 征在于, 所述信息一 致性的获取 过程为: 预设高维向量中每个元素的损失权重, 利用孪生网络获取两个所述高维向量之间的损 失值, 根据每两个高维向量的余弦相似度以及所述损失值计算所述信息一 致性。 5.根据权利要求1所述的方法, 其特 征在于, 所述样本距离的获取 过程为: 依据所述信 息一致的倒数计算所述样本距离; 所述样本距离与 所述信息一致性呈负相 关关系。 6.根据权利要求1所述的方法, 其特 征在于, 所述信息 差异的获取 过程为: 分别计算每张发票图像与同类别其他发票图像对应的高维向量之间的余弦相似度, 根 据所述余弦相似度得到对应的差异度, 将所述差异度求和作为所述信息 差异。 7.根据权利要求1所述的方法, 其特 征在于, 所述 容错系数的获取 过程为: 获取每个类别中所有发票图像的容错率均值, 以所述容错率均值在所有类别中的数值 占比作为该类别的所述 容错系数。 8.根据权利要求1所述的方法, 其特 征在于, 该 方法还包括以下步骤: 当所述识别准确度小于识别阈值时, 对应的发票作为 不能被识别的发票。 9.基于人工智能的定额发票识别准确度评价系统, 包括存储器、 处理器以及存储在所 述存储器中并可在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计 算机程序时实现如权利要求1~8任意 一项所述方法的步骤。权 利 要 求 书 1/1 页 2 CN 114299485 A 2基于人工智能的定额 发票识别准确度评价 方法及系统 技术领域 [0001]本发明涉及人工智能技术领域, 具体涉及基于人工智能的定额发票识别准确度 评 价方法及系统。 背景技术 [0002]发票是发生的成本、 费用或收入的原始凭证。 对于 公司来讲, 发票主要是公司做账 的依据, 同时也是缴税的费用凭证; 而对于员工来讲, 发票主 要是用来报销的。 [0003]对于单位的定额发票需要定期统一录入审核, 此时需要投入大量的人力物力, 去 进行原始票据的采集和信息录入工作, 由于处理的发票数量较多, 票据录入和管理工作繁 重, 既耗费人力, 又耗费时间, 出现了利用人工智能识别发票金额的方法。 但是有些发票可 能会保存时间较长, 识别清晰度不尽相同, 机器识别容易识别失误而录入错误信息, 造成识 别不准确。 发明内容 [0004]为了解决上述技术问题, 本发明的目的在于提供一种基于人工智能的定额发票识 别准确度评价方法及系统, 所采用的技 术方案具体如下: [0005]第一方面, 本发明一个实施例提供了一种基于人工智能的定额发票识别准确度 评 价方法, 该 方法包括以下步骤: [0006]采集定额发票的发票图像, 在所述发票图像中提取发票包围框; 在所述发票包围 框内提取发票的文本信息, 构成高维向量; [0007]对每两张所述发票图像对应的所述高维向量计算信息一致性, 并依据所述信息一 致性获取每两张发票图像之 间的样本距离; 根据所述样本距离将所述发票图像进 行密度聚 类, 分为多个 类别; [0008]获取每张发票图像与同类别其他发票图像之间的信息差异, 进而得到该发票图像 的容错率; 依据每 个类别的所有发票图像的容 错率均值获取 该类别的容 错系数; [0009]根据每张发票图像对应的容错系数以及所述信息差异获取该发票图像的识别准 确度。 [0010]优选的, 所述高维向量的构建过程 为: [0011]截取所述发票包围框 的区域, 对其进行扫描, 得到发票图像中各个关键参数的内 容, 构成所述高维向量; 所述关键参数至少包括发票尺寸、 发票类型、 发票代码和金额。 [0012]优选的, 所述发票尺寸的获取 过程为: [0013]根据所述发票包围框的区域在所述发票图像中的面积占比以及图像采集参数获 取所述发票尺寸。 [0014]优选的, 所述信息一 致性的获取 过程为: [0015]预设高维向量中每个元素的损失权重, 利用孪生网络获取两个所述高维向量之间 的损失值, 根据每两个高维向量的余弦相似度以及所述损失值计算所述信息一 致性。说 明 书 1/6 页 3 CN 114299485 A 3

.PDF文档 专利 基于人工智能的定额发票识别准确度评价方法及系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于人工智能的定额发票识别准确度评价方法及系统 第 1 页 专利 基于人工智能的定额发票识别准确度评价方法及系统 第 2 页 专利 基于人工智能的定额发票识别准确度评价方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:49:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。