团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111680113.7 (22)申请日 2021.12.3 0 (71)申请人 深圳云天励飞技 术股份有限公司 地址 518000 广东省深圳市龙岗区园山 街 道龙岗大道8288号深圳大运软件小镇 17栋1楼 (72)发明人 袁瑾 肖嵘 王孝宇 (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 林韵英 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型蒸馏方法、 装置及电子设备 (57)摘要 本发明实施例涉及一种模型蒸馏方法、 装置 及电子设备, 该方法包括: 对第i个未标记数据进 行第一泛化处理后, 分别输入到至少两个教师网 络模型中, 获取一组第一识别结果; 根据一组第 一识别结果, 获取第二识别结果; 当至少一个备 选标签中第一备选标签的预测概率大于或者等 于预设概率阈值时, 将第一备选标签 设定为未标 记数据的伪标签; 对第i个未标记数据进行第二 泛化处理后, 输入到学生网络模型中, 获取第三 识别结果; 根据第二识别结果、 第三识别结果, 以 及伪标签, 对学生网络模型进行优化, 直至学生 网络模型符合预设标准时结束。 通过该方式, 大 大降低人力标记的成本 。 权利要求书2页 说明书10页 附图4页 CN 114519416 A 2022.05.20 CN 114519416 A 1.一种模型蒸馏方法, 其特 征在于, 所述方法包括: 对第i个未标记数据进行第 一泛化处理后, 分别输入到至少两个教师网络模型中, 获取 一组第一识别结果; 根据一组所述第 一识别结果, 获取第 二识别结果, 其中第 二识别结果包括第 i个所述未 标记数据的至少一个备选标签, 以及每一个所述备选标签对应的预测概 率; 当至少一个所述备选标签中第 一备选标签的预测概率大于或者等于预设概率阈值 时, 将所述第一备选标签设定为所述未标记数据的伪标签, 其中, 所述第一备选标签为至少一 个所述备选标签中概 率最大的标签; 对第i个所述未标记数据进行第 二泛化处理后, 输入到学生网络模型中, 获取第 三识别 结果; 根据所述第二识别结果、 所述第 三识别结果, 以及所述伪标签, 对所述学生网络模型进 行优化, 直至所述学生网络模型符合预设标准时结束, 其中, i 为正整数。 2.根据权利要求1所述的方法, 其特征在于, 对第 i个未标记数据进行第 一泛化处理后, 分别输入到 至少两个教师网络模型中, 获取一组第一识别结果, 具体包括: 分别对第i个所述未 标记数据执 行不同类型的弱增广处 理; 将经过不同类型的弱增广处理后的未标记数据, 对应输入到不同的教师网络模型中, 获取一组所述第一识别结果。 3.根据权利要求1或2所述的方法, 其特征在于, 所述第 一识别结果包括与第 i个所述未 标记数据对应的至少一个备选标签, 以及每一个所述备选标签对应的第一 候选概率; 所述根据一组所述第一识别结果, 获取第二识别结果, 具体包括: 分别获取一组所述第一识别结果中相同备选标签对应的第一候选概率的第一概率平 均值; 所述第一识别结果中的至少一个备选标签, 以及每一个备选标签对应的第 一概率平均 值构成所述第二识别结果, 其中每一个备选标签对应的第一概率平均值, 即为所述第二识 别结果中与所述备选标签对应的预测概 率。 4.根据权利要求1所述的方法, 其特征在于, 所述对第i个所述未标记数据进行第二泛 化处理后, 输入到学生网络模型中, 获取第三识别结果, 具体包括: 分别对第i个所述未 标记数据进行强增广处 理; 将经过强增广处理后的未标记数据, 输入到所述学生网络模型中, 获取所述第三识别 结果。 5.根据权利要求1、 2或4任一项所述的方法, 其特征在于, 所述第三识别结果中包括: 第 i个所述未标记数据的至少一个备选标签中每一个备选标签对应的第二候选概率, 与第i个 所述未标记数据对应的目标 标签; 所述根据所述第 二识别结果、 所述第 三识别结果, 以及所述伪标签, 对所述学生网络模 型进行优化, 具体包括: 根据所述第 二识别结果中每一个备选标签对应的第 一概率平均值, 以及所述第 三识别 结果中每一个备选标签对应的第二 候选概率, 确定第一损失函数; 根据所述伪标签以及所述目标 标签, 确定第二损失函数; 根据所述第一损失函数和所述第二损失函数, 对所述学生网络模型进行优化。权 利 要 求 书 1/2 页 2 CN 114519416 A 26.一种多模型蒸馏装置, 其特 征在于, 所述装置包括: 处理模块, 用于对第i个未标记数据进行第一泛化处理后, 分别输入到至少两个教师网 络模型中, 获取一组第一识别结果; 根据一组所述第一识别结果, 获取第二识别结果, 其中 第二识别结果包括第i个所述未标记数据的至少一个备选标签, 以及每一个所述备选标签 对应的预测概 率; 设定模块, 用于当至少一个所述备选标签中第 一备选标签的预测概率大于或者等于预 设概率阈值时, 将所述第一备选标签设定为所述未标记数据的伪标签, 其中, 所述第一备选 标签为至少一个所述备选标签中概 率最大的标签; 所述处理模块, 还用于对第 i个所述未标记数据进行第 二泛化处理后, 输入到学生网络 模型中, 获取第三识别结果; 优化模块, 根据所述第二识别结果、 所述第三识别结果, 以及所述伪标签, 对所述学生 网络模型进行优化, 直至所述学生网络模型符合预设标准时结束, 其中, i 为正整数。 7.根据权利要求6所述的装置, 其特 征在于, 所述处 理模块, 具体用于: 分别对第i个所述未 标记数据执 行不同类型的弱增广处 理; 将经过不同类型的弱增广处理后的未标记数据, 对应输入到不同的教师网络模型中, 获取一组所述第一识别结果。 8.根据权利要求6或7所述的装置, 其特征在于, 所述第 一识别结果包括与第 i个所述未 标记数据对应的至少一个备选标签, 以及每一个所述备选标签对应的第一 候选概率; 所述处理模块, 具体用于: 分别获取一组所述第一识别结果中相同备选标签对应的第 一候选概率的第一 概率平均值; 所述第一识别结果中的至少一个备选标签, 以及每一个备选标签对应的第 一概率平均 值构成所述第二识别结果, 其中每一个备选标签对应的第一概率平均值, 即为所述第二识 别结果中与所述备选标签对应的预测概 率。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑5任一项所述的模型蒸馏 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1 ‑5任一项所述的模型蒸馏方法的步骤。权 利 要 求 书 2/2 页 3 CN 114519416 A 3
专利 模型蒸馏方法、装置及电子设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:51:15
上传分享
举报
下载
原文档
(676.0 KB)
分享
友情链接
GB-T 26119-2010 绿色制造 机械产品生命周期评价 总则.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
GB-T 42433-2023 珠宝玉石鉴定 红外光谱法.pdf
GB-T 36030-2018 制药机械(设备 在位清洗、灭菌通用技术要求.pdf
TB-T 1346-2018 木枕用道钉.pdf
T-IMCPNT 001—2024 中国马奶之乡特色产业示范旗建设与管理指南.pdf
GB-T 24936-2010 全地形车 术语.pdf
GB-T 36643-2018 信息安全技术 网络安全威胁信息格式规范.pdf
T-CNFPIA 3007—2019 超薄高密度纤维板.pdf
DB43-T 1315-2023 森林城市评价指标 湖南省.pdf
DB13-T 2802-2018 水利工程铸铁闸门技术规范 河北省.pdf
TB-T 1669-2018 机车车辆车钩及缓冲装置计量器具 13型车钩量具.pdf
T-GDSCEE 111—2023 舞台灯具跌落试验规范.pdf
T-SDL 3.4—2021 10 kV智能电缆系统技术规范 第4部分 10 kV交联聚乙烯绝缘智能电力电缆附件.pdf
专利 一种基于大数据计算机网络安全防护装置.PDF
DB32/T 4417-2022 特色田园乡村建设标准 江苏省.pdf
GB-T 18771.5-2015 烟草术语 第5部分:烟草机械与烟草专用检测仪器.pdf
GB-T 38994-2020 船舶数字化协同制造技术通用要求.pdf
法律法规 计算机信息网络国际联网安全保护管理办法2011-01-08.pdf
ISO 17987-6-2016.pdf
1
/
3
17
评价文档
赞助2元 点击下载(676.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。