团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111650469.6 (22)申请日 2021.12.3 0 (71)申请人 厦门市美亚柏科信息股份有限公司 地址 361000 福建省厦门市思明区软件园 二期观日路12号102-402单 元 (72)发明人 陈博文 林淑强 徐晶 刘源 张春晖 魏炜途 (74)专利代理 机构 厦门福贝知识产权代理事务 所(普通合伙) 35235 代理人 郭涵炜 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 40/16(2022.01) G06K 9/62(2022.01)G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) (54)发明名称 一种神经网络训练方法、 装置、 设备及存储 介质 (57)摘要 本发明提出了一种神经网络训练方法、 装 置、 设备及存储介质, 该方法包括: 获取步骤, 获 取用于神经网络训练的样本集, 所述样本集包括 多个不同类别的图片; 优化步骤, 优化现有的神 经网络模型损失函数, 减小每个神经元由于分类 样本不均衡导致的梯度方向偏差; 训练步骤, 使 用优化后的损失函数对所述神经网络使用所述 样本集进行训练得到训练好的神经网络模型。 本 发明通过对损失函数进行优化, 从而减小由于分 类样本不均衡导致的梯度方向偏 差, 减小的含义 是, 在同样的样本集经过同样的训练次数后, 梯 度方向的偏 差相比现有 方案更小, 其可以解决由 于现有损失函数导 致的缺陷。 权利要求书2页 说明书5页 附图2页 CN 114372560 A 2022.04.19 CN 114372560 A 1.一种神经网络训练方法, 该神经网络用于有序回归任务的处理, 其特征在于, 该方法 包括: 获取步骤, 获取用于神经网络训练的样本集, 所述样本集包括多个不同类别的图片; 优化步骤, 优化现有的神经网络模型损 失函数, 减小每个神经元由于分类样本不均衡 导致的梯度方向偏差; 训练步骤, 使用优化后的损失函数对所述神经网络使用所述样本集进行训练得到训练 好的神经网络模型。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 预测步骤, 使用所述训练好的神经网络模型对输入的测试图像进行年龄预测。 3.根据权利要求2所述的方法, 其特征在于, 在所述优化步骤中, 所述优化后的损 失函 数为: 其中, l′n为第n个神经元的损失函数, L ′为所述神经网络模型总损失函数, γ和α 为超 参 数, N为神经元总数, ln=‑(ynlogxn+(1‑yn)log(1‑xn))为优化前的第n个神经 元的损失函数。 4.一种神经网络训练装置, 该神经网络用于有序回归任务的处理, 其特征在于, 该装置 包括: 获取单元, 获取用于神经网络训练的样本集, 所述样本集包括多个不同类别的图片; 优化单元, 优化现有的神经网络模型损 失函数, 减小每个神经元由于分类样本不均衡 导致的梯度方向偏差; 训练单元, 使用优化后的损失函数对所述神经网络使用所述样本集进行训练得到训练 好的神经网络模型。 5.根据权利要求 4所述的装置, 其特 征在于, 所述装置还 包括: 预测单元, 使用所述训练好的神经网络模型对输入的测试图像进行年龄预测。 6.根据权利要求7所述的装置, 其特征在于, 在所述优化单元中, 所述优化后的损 失函 数为: 其中, l′n为第n个神经元的损失函数, L ′为所述神经网络模型总损失函数, γ和α 为超 参 数, N为神经元总数, ln=‑(ynlogxn+(1‑yn)log(1‑xn))为优化前的第n个神经 元的损失函数。 7.一种神经网络训练设备, 所述设备包括处理器和存储器, 所述处理器与所述处理器 通过总线连接, 所述存储器上存储有计算机程序, 所述处理器执行所述存储器上 的计算机 程序时实现权利要求1 ‑3任一项的方法。 8.一种计算机存储介质, 所述计算机存储介质上存储有计算机程序, 当所述计算机存权 利 要 求 书 1/2 页 2 CN 114372560 A 2储介质上的计算机程序被处 理器执行时实现权利要求1 ‑3任一项的方法。权 利 要 求 书 2/2 页 3 CN 114372560 A 3
专利 一种神经网络训练方法、装置、设备及存储介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:48:49
上传分享
举报
下载
原文档
(643.0 KB)
分享
友情链接
GB-T 34807-2017 岩土工程仪器设备的检验测试通用技术规范.pdf
T-ZZB 2034—2021 食品包装用阻隔塑料杯.pdf
GB-T 42768-2023 公共安全 城市安全风险评估.pdf
T-CSAE 284.3—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第3部分:转向系统.pdf
GM-T 0100-2020 人工确权型数字签名密码应用技术要求.pdf
ISO 17825-2016.pdf
GB-T 31392-2022 煤矿矿井水利用技术导则.pdf
GB-T 33746.1-2017 近场通信(NFC)安全技术要求 第1部分:NFCIP-1安全服务和协议.pdf
GB-T 42767-2023 城市垃圾收集装置设置通用要求.pdf
GB-T 9651-2008 单相异步电动机试验方法.pdf
DB52-T 1540.2-2021 政务数据 第2部分:元数据管理规范 贵州省.pdf
T-CESA 1208—2022 光伏组件节能量计算方法.pdf
GB-T 26973-2011 空气源热泵辅助的太阳能热水系统 储水箱容积大于0.6m3 技术规范.pdf
GB-T 12521-2008 空气潜水减压技术要求.pdf
XF 869-2010 消防员灭火防护头套.pdf
国测 2020年教育行业网络安全白皮书.pdf
思度安全-DSMM-001 数据安全管理总纲V1.0.pdf
山西省大数据发展应用促进条例.pdf
GB-T 35289-2017 信息安全技术 电子认证服务机构服务质量规范.pdf
T-SLEA 1011.1—2023 实验室设计与建设技术规范 第1部分:通用技术要求.pdf
1
/
3
10
评价文档
赞助2元 点击下载(643.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。