团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111683696.9 (22)申请日 2021.12.31 (71)申请人 深存科技 (无锡) 有限公司 地址 214115 江苏省无锡市新吴区弘 毅路 10号金乾 座401、 402室 (72)发明人 陆能 (74)专利代理 机构 北京市中伦律师事务所 11410 专利代理师 钟锦舜 (51)Int.Cl. G06N 3/08(2006.01) G06N 5/04(2006.01) G06K 9/62(2022.01) G06V 10/70(2022.01) G06V 10/82(2022.01)G06V 10/764(2022.01) (54)发明名称 训练深度学习模 型的方法和装置、 电子设备 及存储介质 (57)摘要 本公开提供用 于训练深度学习模型的方法 和装置、 电子设备及存储介质, 该方法包括: 使用 第一训练数据集开始对待训练模型进行迭代训 练; 筛选推理错误的样本数据和推理正确的样本 数据; 对所筛选的推理错误的样 本数据进行数据 增强; 基于经所述数据增强的推理错误的样本数 据和所筛选的推理正确的样本数据生成第二训 练数据集; 以及在使用所述第二训练数据集进行 进一步训练后, 使用所述第一训练数据集继续进 行迭代训练。 本公开能够在深度学习模型的训练 过程中基于推理错误的样本数据进行动态调整 生成新的训练数据集, 从而优化深度学习模型的 训练过程, 进而改善深度学习模 型的训练效率和 训练后的预测性能。 权利要求书2页 说明书9页 附图2页 CN 114492788 A 2022.05.13 CN 114492788 A 1.一种训练深度学习模型的方法, 包括: 使用第一训练数据集 开始对待训练模型进行迭代训练; 筛选推理错 误的样本数据和推理正确的样本数据; 对所筛选的推理错 误的样本数据进行 数据增强; 基于经所述数据增强的推理错误的样本数据和所筛选的推理正确的样本数据生成第 二训练数据集; 以及 在使用所述第 二训练数据集进行进一步训练后, 使用所述第 一训练数据集继续进行迭 代训练。 2.根据权利要求1所述的方法, 其中所述筛选推理错误的样本数据和推理正确的样本 数据包括: 基于在至少一轮的迭代训练中推理错误的样本数据构 成推理错误信 息集, 其中所述推 理错误信息集中包括所述推理错误的样本数据的索引和在所述至少一轮的迭代训练中的 推理错误置信度; 以及 在所述至少一轮的迭代训练中选择推理正确的样本数据以构 成推理正确信 息集, 使得 所选的推理正确的样本数据在标签信息和推理正确置信度方面分布基本均衡, 其中所述推 理正确信息集包括所选择的推理正确的样本数据的索引。 3.根据权利要求2所述的方法, 其中所述对所筛选的推理错误的样本数据进行数据增 强包括: 基于所述推理错 误信息集中的索引获取 所筛选的推理错 误的样本数据, 其中所述对所筛 选的推理错 误的样本数据进行 数据增强还 包括: 对于每个所获取的推理错误的样本数据, 进行与基于在所述推理错误信 息集中的推理 错误重复次数和各自的推理错 误置信度正相关的数据增强; 和/或 对于每个所获取的推理错误的样本数据, 基于与 所述推理错误置信度正相关的加权值 进行数据增强。 4.根据权利要求2所述的方法, 其中在基于经所述数据增强的推理错误的样本数据和 所筛选的推理正确的样本数据生成第二训练数据集之前, 所述方法还 包括: 基于所述推理正确信息集中的索引获取 所筛选的推理正确的样本数据。 5.根据权利要求1所述的方法, 其中使用所述第二训练数据集进行至少一轮的训练。 6.根据权利要求1所述的方法, 其中在使用所述第 二训练数据集进行进一步训练后, 使 用所述第一训练数据集继续进行迭代训练, 直到训练完成。 7.根据权利要求1所述的方法, 还包括: 以迭代方式重复执行训练优化操作, 直到训练 完成, 其中所述训练优化操作包括: 筛选推理错 误的样本数据和推理正确的样本数据; 对所筛选的推理错 误的样本数据进行 数据增强; 基于经所述数据增强的推理错误的样本数据和所筛选的推理正确的样本数据生成优 化训练数据集; 以及 在使用所述优化训练数据集进行进一步训练后, 使用所述第 一训练数据集继续进行迭 代训练。 8.根据权利要求2所述的方法, 其中所述基于在至少一轮的迭代训练中推理错误的样 本数据构成推理错 误信息集包括:权 利 要 求 书 1/2 页 2 CN 114492788 A 2在确定第N轮迭代训练的结果满足预设条件时, 从第N+1轮迭代训练开始确定每轮迭代 训练中推理错误的样本数据以用于构成所述推理错误信息集, 直到基于所述推理错误信息 集确定截止到第M轮迭代训练的总推理错误次数超过预设次数, 其中N是不小于1的正整 数, M是大于N的正整数。 9.根据权利要求8所述的方法, 其中所述在所述至少一轮的迭代训练中选择推理正确 的样本数据以构成推理正确信息集包括: 在基于所述推理错误信 息集确定截止到第M轮迭代训练 的总推理错误 次数超过预设次 数时, 在第M轮迭代训练中确定推理正确的样本数据并在从中进行选择。 10.一种用于训练深度学习模型的装置, 包括训练单元、 数据筛选单元、 数据增强单元 以及生成单 元, 其中: 所述训练单 元用于使用第一训练数据集 开始对待训练模型进行迭代训练; 所述数据筛 选单元用于筛选推理错 误的样本数据和推理正确的样本数据; 所述数据增强单 元用于对所筛 选的推理错 误的样本数据进行 数据增强; 所述生成单元用于基于经所述数据增强的推理错误的样本数据和所筛选的推理正确 的样本数据生成第二训练数据集; 所述训练单元还用于使用所述第 二训练数据集进行进一步训练, 并且还用于在所述进 一步训练后使用所述第一训练数据集继续进行迭代训练。 11.一种电子设备, 包括: 至少一个处理器; 以及与所述至少一个处理器通信连接的存 储器, 其中所述存储器存储有可被所述至少一个处理器执行 的指令, 所述指令在被所述至 少一个处理器执行时使得所述电子设备执行如权利要求1至9中任一项所述的训练深度学 习模型的方法。 12.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中所述计算机指令用于 使计算机执 行如权利要求1至9中任一项所述的训练深度学习模型的方法。权 利 要 求 书 2/2 页 3 CN 114492788 A 3
专利 训练深度学习模型的方法和装置、电子设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:51:54
上传分享
举报
下载
原文档
(525.5 KB)
分享
友情链接
腾讯安全 物联网汽车安全.pdf
DB13-T 5087-2019 超低能耗交通附属建 筑节能应用设计导则 河北省.pdf
GB-T 29920-2013 电工用稀土高铁铝合金杆.pdf
DB23-T 3649.8—2023 政府网站建设管理规范 第8部分:集约化平台运维 黑龙江省.pdf
T-CSAE 262—2022 电动汽车电池管理系统用故障注入测试规范.pdf
GB-T 14506.14-2010 硅酸盐岩石化学分析方法 第14部分:氧化亚铁量测定.pdf
NY-T 3850-2021 设施果菜秸秆原位还田技术规程.pdf
GB-T 31000-2015 社会治安综合治理基础数据规范.pdf
GB-T 14844-2018 半导体材料牌号表示方法.pdf
GB-T 43156-2023 地理信息 矢量数据模型与存储规范.pdf
法律法规 最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释2019-10-21.pdf
GB-T 33929-2017 MEMS高g值加速度传感器性能试验方法.pdf
GB-T 15319-1994 火焰加热炉节能监测方法.pdf
GB-T 5375-2006 摩托车和轻便摩托车型号编制方法.pdf
GB-T 3364-2008 碳纤维直径和根数试验方法.pdf
T-CFA 031103.5--2018—2018 铸造数字化工厂通用技术要求.pdf
GB-T 40018-2021 信息安全技术 基于多信道的证书申请和应用协议.pdf
OWASP 移动安全测试指南 v1.0.pdf
GB-T 14555-2015 船用导航雷达接口及安装要求.pdf
YD-T 4177.11-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第11部分:短信信息.pdf
1
/
3
14
评价文档
赞助2元 点击下载(525.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。