团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111679775.2 (22)申请日 2021.12.31 (71)申请人 北京五八信息技 术有限公司 地址 100083 北京市海淀区学清路甲18号 中关村东升科技园学院园三层3 01室 (72)发明人 高文龙 曾钦榜 周超 (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 吕俊秀 (51)Int.Cl. G06F 16/34(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种标题生成方法、 装置、 电子设备和存储 介质 (57)摘要 本发明实施例提供了一种标题 生成方法、 装 置、 电子设备和存储介质, 所述方法包括: 获取待 处理文本; 根据待处理文本, 得到至少一个输入 词以及至少一个输入词对应的输入词嵌入信息; 将输入词嵌入信息输入预先训练的标题生成模 型进行处理, 得到输出词; 标题生成模型包括编 码层、 注意力层和解码层; 通过编码层基于输入 词嵌入信息, 得到输入词对应属性的语义特征; 通过注意力层基于输入词对应属性的语义特征, 得到输入词的注意力向量; 通过解码层基于注意 力向量, 从至少一个输入词中抽取得到至少一个 输出词, 确定待处理文本的标题。 本申请实施例 可以生成个性化标题, 避免重复生成文本以及生 成错误信息, 提高标题内容的准确性, 从而提高 用户的点击率。 权利要求书2页 说明书14页 附图4页 CN 114491004 A 2022.05.13 CN 114491004 A 1.一种标题生成方法, 其特 征在于, 包括: 获取待处 理文本; 根据所述待处理文本, 得到至少一个输入词以及所述至少一个输入词对应的输入词嵌 入信息; 将所述输入词嵌入信息输入预先训练的标题生成模型进行处理, 得到输出词; 所述标 题生成模型包括编码层、 注意力 层和解码层; 通过所述编 码层基于所述输入词嵌入信息, 得 到所述输入词对应属性的语义特征; 通过所述注 意力层基于所述输入词对应属性的语义特 征, 得到所述输入词的注意力向量; 通过所述解码层基于所述注意力向量, 从所述至少一个 输入词中抽取 得到至少一个输出词; 根据所述至少一个输出词, 确定所述待处 理文本的标题。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述待处理文本, 得到至少一个 输入词以及所述至少一个输入词对应的输入词嵌入信息, 包括: 对所述待处 理文本进行信息抽取, 得到多个属性和所述多个属性对应的输入词; 根据所述输入词对应属性和所述输入词在所述输入词对应属性对应的所有输入词中 的位置信息, 得到 输入词嵌入信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述编码层包括LSTM单元和属性编码单 元; 所述通过所述编 码层基于所述输入词嵌入信息, 得到所述输入词对应属性的语义特征, 包括: 将所述输入词嵌入信息 输入所述属性编码单 元进行编码, 得到 输入词属性编码信息; 将所述输入词属性编码信息输入所述LSTM单元, 由所述LSTM单元将所述输入词属性编 码信息结合到每一时间步输出的 隐藏状态中, 得到所述输入词的整体语义特征和所述输入 词对应属性的语义特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述通过所述注意力层基于所述输入词对 应属性的语义特 征, 得到所述输入词的注意力向量, 包括: 将所述输入词的整体语义特征和所述输入词对应属性的语义特征输入所述注意力层, 得到所述输入词的注意力权 重和所述输入词对应属性的注意力权 重; 根据所述输入词的注意力 权重和所述输入词对应属性的注意力 权重, 确定所述输入词 的双注意力权 重; 根据所述输入词的双注意力 权重和所述输入词的整体语义特征, 得到所述输入词的注 意力向量。 5.根据权利要求4所述的方法, 其特征在于, 所述解码层包括LSTM单元; 所述通过所述 解码层基于所述注意力向量, 从所述至少一个输入词中抽取 得到至少一个输出词, 包括: 将所述输入词的注意力向量和所述待处理文本序列的起始标识输入所述LSTM单元, 由 所述LSTM单元输出当前时间步所述至少一个输入词中输出概率最高的词以及当前时间步 的隐藏状态; 将当前时间步输出的隐藏状态以及当前时间步的输出词输入所述LSTM单元, 由所述 LSTM单元输出下一时间步所述至少一个输出词中输出概率最高的词以及下一时间步的隐 藏状态; 当下一时间步的输出词为结束标识时, 停止 输出输出概 率最高的词。权 利 要 求 书 1/2 页 2 CN 114491004 A 26.根据权利要求1所述的方法, 其特 征在于, 通过如下 方式训练所述标题生成模型: 获取训练数据, 所述训练数据包括训练文本和所述训练文本对应的文本标注; 根据所述训练文本, 得到所述训练文本的嵌入信息; 将所述训练文本的嵌入信 息作为所述标题生成模型的输入; 所述标题生成模型包括编 码层、 注意力 层和解码层; 通过所述编 码层基于所述嵌入信息, 得到所述训练文本中各个词 对应属性的语义特征; 通过所述注意力层基于所述各个词对应属 性的语义特征, 得到所述 各个词的注意力向量; 通过所述解码层基于所述注意力向量, 从所述训练文本中抽取得到 至少一个输出词; 根据所述至少一个输出词和所述文本标注, 确定 输出误差信息; 根据所述输出误差信息, 调整所述标题生成模型的参数, 以对所述标题生成模型进行 训练。 7.根据权利要求6所述的方法, 其特征在于, 所述解码层包括LSTM单元; 所述文本标注 包括预设的标准输出词; 所述根据所述至少一个输出词和所述文本标注, 确定输出误差信 息, 包括: 将所述LSTM单元当前时间步的输出词与预设的标准输出词进行对比, 得到当前时间步 的输出误差信息 。 8.一种标题生成装置, 其特 征在于, 所述装置包括: 文本获取模块, 用于获取待处 理文本; 嵌入信息确定模块, 用于根据所述待处理文本, 得到至少一个输入词以及所述至少一 个输入词对应的输入词嵌入信息; 模型处理模块, 用于将所述输入词嵌入信息输入预先训练的标题生成模型进行处理, 得到输出词; 所述标题生成模型包括编 码层、 注意力层和解码层; 通过所述编码层基于所述 输入词嵌入信息, 得到所述输入词对应属 性的语义特征; 通过所述注意力层基于所述输入 词对应属 性的语义特征, 得到所述输入词的注意力向量; 通过所述解码层基于所述注意力 向量, 从所述至少一个输入词中抽取 得到至少一个输出词; 标题确定模块, 用于根据所述至少一个输出词, 确定所述待处 理文本的标题。 9.一种电子设备, 其特征在于, 包括: 处理器、 存储器及存储在所述存储器上并能够在 所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求 1‑ 7中任一项所述的标题生成方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求 1至7中任一项 所述的标题生成方法的 步骤。权 利 要 求 书 2/2 页 3 CN 114491004 A 3
专利 一种标题生成方法、装置、电子设备和存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:48:30
上传分享
举报
下载
原文档
(937.2 KB)
分享
友情链接
GB-T 32917-2016 信息安全技术 WEB应用防火墙安全技术要求与测试评价方法.pdf
GB-T 16296.1-2018 声学 测听方法 第1部分:纯音气导和骨导测听法.pdf
GM-T 0056-2018 多应用载体密码应用接口规范.pdf
GB-T 32429-2015 信息技术 SOA 应用的生存周期过程.pdf
DL-T 5807-2020 水电工程岩体稳定性微震监测技术规范.pdf
DB11-T 715-2018 公共汽电车场站功能设计要求 北京市.pdf
GB-T 30287.3-2013 卫星定位船舶信息服务系统 第3部分:信息安全规范.pdf
GB-T 42615-2023 在用电梯安全评估规范.pdf
NB-T 10178-2019 煤矿在用继电保护装置电气试验规范.pdf
GB-T 19713-2005 信息技术 安全技术 公钥基础设施 在线证书状态协议.pdf
YD-T 4244-2023 电信网和互联网数据分类分级技术要求与测试方法.pdf
DB15-T 3069—2023 乳苣育苗移栽技术规程 内蒙古自治区.pdf
DB52-T 1558-2021 大数据安全服务人员能力评价 贵州省.pdf
GB-T 18916.57-2021 取水定额 第57部分:乳制品.pdf
JR-T 0071.4—2020 金融行业网络安全等级保护实施指引 第4部分:培训指引.pdf
T-CCMI 10—2020 热锻冷锻联合成形驻车棘 轮技术条件.pdf
CISSP官方学习指南(OSG)第9版 中文版.pdf
GM-T 0035.2-2014 射频识别系统密码应用技术要求 第2部分:电子标签芯片密码应用技术要求.pdf
中国银保监会办公厅关于印发银行保险机构信息科技外包风险监管办法的通知.pdf
DL-T 2015-2019 电力信息化软件工程度量规范.pdf
1
/
3
21
评价文档
赞助2元 点击下载(937.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。