团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111680641.2 (22)申请日 2021.12.31 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 刘运璇  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 代理人 樊晓 (51)Int.Cl. G06F 16/335(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 信息推荐模 型的训练方法、 信息推荐 方法及 装置 (57)摘要 本公开提供了一种信息推荐模型的训练方 法、 信息推荐方法及装置、 电子设备和计算机可 读存储介质, 可以应用于人工智能技术领域和金 融领域。 该信息推荐模型的训练方法包括: 获取 训练样本数据集, 其中, 训练样本数据集中的训 练样本包括经预处理后的报警信息以及报警信 息的标签信息, 报警信息包括报警文本和与 报警 文本对应的报警手册文本, 经预处理后的报警信 息包括报警文本的词向量和报警手册文本的词 向量; 以及利用训练样本数据集训练信息推荐模 型, 得到经训练的信息 推荐模型。 权利要求书3页 说明书16页 附图5页 CN 114328891 A 2022.04.12 CN 114328891 A 1.一种信息推荐模型的训练方法, 包括: 获取训练样本数据集, 其中, 所述训练样本数据集中的训练样本包括经预处理后的报 警信息以及所述报警信息的标签信息, 所述报警信息包括报警文本和与所述报警文本对应 的报警手册文本, 所述经预处理后的报警信息包括所述报警文本的词向量和所述报警手册 文本的词向量; 以及 利用所述训练样本数据集训练所述信息推荐模型, 得到经训练的信息推荐模型。 2.根据权利要求1所述的方法, 其中, 所述信 息推荐模型包括特征提取网络和特征匹配 网络, 所述利用所述训练样本数据集训练所述信息推荐模型, 得到经训练的信息推荐模型 包括: 利用所述特 征提取网络, 提取 所述训练样本数据集中的初始特 征数据; 利用所述特 征匹配网络, 处 理所述初始特 征数据, 得到处 理向量; 根据信息推荐模型的损失函数, 利用所述处 理向量与所述标签信息, 得到损失结果; 根据所述损失结果调整所述信 息推荐模型的网络参数, 直至所述损失函数满足预设条 件; 以及 将所述损失函数满足预设条件时得到的模型确定为所述信息推荐模型。 3.根据权利要求2所述的方法, 其中, 所述特征提取网络包括问题特征提取网络和答案 特征提取网络, 所述利用所述特征提取网络, 提取所述训练样本数据集中的初始特征数据 包括: 利用所述问题特征提取网络, 提取所述训练样本数据集中所述报 警文本的词向量的初 始问题特 征数据; 利用所述答案特征提取网络, 提取所述训练样本数据集中所述报 警手册文本的词向量 的初始答案特 征数据。 4.根据权利要求3所述的方法, 其中, 所述问题特征提取网络包括第 一双向长短期记忆 网络层、 第一卷积层、 第二卷积层 及第三卷积层; 所述利用所述问题特征提取网络, 提取所述训练样本数据集中所述报 警文本的词向量 的初始问题特 征数据包括: 利用所述第 一双向长短期记忆网络层, 处理所述训练样本数据集中的所述报 警文本的 词向量, 得到初始问题特 征向量; 利用所述第一卷积层, 处 理所述初始问题特 征向量, 得到第一特 征向量; 利用所述第二卷积层, 处 理所述第一特 征向量, 得到第二特 征向量; 利用所述第三卷积层, 处 理所述第二特 征向量, 得到第三特 征向量; 以及 根据所述初始问题特征向量和所述第 三特征向量, 确定所述训练样本数据集的所述初 始问题特 征数据。 5.根据权利要求4所述的方法, 其中, 所述答案特征提取网络包括第 二双向长短期记忆 网络层、 第四卷积层、 第五卷积层 及第六卷积层; 所述利用所述答案特征提取网络, 提取所述训练样本数据集中所述报 警手册文本的词 向量的初始答案特 征数据包括: 利用所述第 二双向长短期记忆网络层, 处理所述训练样本数据集中的所述报 警手册文 本的词向量, 得到初始答案特 征向量;权 利 要 求 书 1/3 页 2 CN 114328891 A 2利用所述第四卷积层, 处 理所述初始答案特 征向量, 得到第四特 征向量; 利用所述第五卷积层, 处 理所述第四特 征向量, 得到第五特 征向量; 利用所述第六 卷积层, 处 理所述第五特 征向量, 得到第六 特征向量; 以及 根据所述初始答案特征向量和所述第六特征向量, 确定所述训练样本数据集的所述初 始答案特 征数据。 6.根据权利要求5所述的方法, 其中: 所述第一卷积层和所述第四卷积层均包括2x2卷积核, 其中, 所述2x2卷积核 的空洞率 为1; 所述第二卷积层和所述第五卷积层均包括2x2卷积核, 其中, 所述2x2卷积核 的空洞率 为2; 所述第三卷积层和所述第六卷积层均包括2x2卷积核, 其中, 所述2x2卷积核 的空洞率 为4。 7.根据权利要求6所述的方法, 其中, 所述特征匹配网络包括问题特征匹配网络和答案 特征匹配网络, 所述利用所述特 征匹配网络, 处 理所述初始特 征数据, 得到处 理向量包括: 利用所述问题特征匹配网络, 处理所述初始问题特征数据, 得到与所述标签信息对应 的问题处 理向量; 利用所述答案特征匹配网络, 处理所述初始答案特征数据, 得到与所述标签信息对应 的答案处 理向量。 8.根据权利要求7所述的方法, 其中, 所述问题特征匹配网络包括第 一注意力层和第 一 长短期记 忆网络层; 所述利用所述问题特征匹配网络, 处理所述初始问题特征数据, 得到与所述标签信息 对应的问题处 理向量包括: 利用所述第 一注意力层对所述初始问题特征数据和所述初始答案特征数据进行加权, 得到第一目标 特征向量; 利用所述第一长短期记忆网络层, 处理所述第一目标特征向量, 得到与所述标签信息 对应的所述问题处 理向量。 9.根据权利要求7所述的方法, 其中, 所述答案特征匹配网络包括第 二注意力层和第 二 长短期记 忆网络层; 所述利用所述答案特征匹配网络, 处理所述初始答案特征数据, 得到与所述标签信息 对应的答案处 理向量包括: 利用所述第 二注意力层对所述初始答案特征数据和所述初始问题特征数据进行加权, 得到第二目标 特征向量; 利用所述第二长短期记忆网络层, 处理所述第二目标特征向量, 得到与所述标签信息 对应的所述 答案处理向量。 10.根据权利要求9所述的方法, 其中, 所述将所述处理向量与所述标签信息输入至待 训练的信息推荐模型的损失函数, 得到损失结果包括: 根据信息推荐模型的损 失函数, 利用所述问题处理向量、 所述答案处理向量与所述标 签信息, 得到损失结果。 11.一种信息推荐方法, 包括:权 利 要 求 书 2/3 页 3 CN 114328891 A 3

.PDF文档 专利 信息推荐模型的训练方法、信息推荐方法及装置

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息推荐模型的训练方法、信息推荐方法及装置 第 1 页 专利 信息推荐模型的训练方法、信息推荐方法及装置 第 2 页 专利 信息推荐模型的训练方法、信息推荐方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:49:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。