团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111672056.8 (22)申请日 2021.12.31 (71)申请人 四川启睿 克科技有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都高新区天府四街 199号1栋33层 (72)发明人 李焕 谭斌 杨兰 饶璐 周兴发 孙锐 展华益 (74)专利代理 机构 四川省成 都市天策商标专利 事务所(有限合 伙) 51213 代理人 刘堋 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01)G06F 40/126(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于语句补全的多轮对话领域识别方 法和装置 (57)摘要 本发明公开了一种基于语句补全的多轮对 话领域识别方法及装置, 方法包括: 将历史对话 语料和每个领域转换为语义向量; 按顺序考虑第 N个领域, 将该领域的语义向量和历史语料的语 义向量输入到语句补全模型, 得到补全后的句 子; 将第N个领域补全后的句子输入到有效性判 定模型, 若判定为有效, 第N个领域即为识别结 果, 否则跳转回步骤二, 继续考虑第N+1个领域。 本发明将多轮对话领域识别任务和语句补全任 务结合起来, 可以很好地识别用户在多轮对话中 回复省略句的情况。 此外本发明既利用了对话的 历史信息, 又保证了历史信息不会对 领域切换造 成干扰, 从而提高识别的准确性。 权利要求书1页 说明书4页 附图1页 CN 114328876 A 2022.04.12 CN 114328876 A 1.一种基于语句补全的多轮对话领域识别方法, 其特 征在于, 包括: 步骤一, 将历史对话语料和每 个领域转换为语义向量; 步骤二, 按顺序考虑第N个领域, 将该领域的语义向量和历史语料的语义向量输入到语 句补全模型, 得到补全后的句子; 步骤三, 将第N个领域补全后的句子输入到有效性判定模型, 若判定为有效, 第N个领域 即为识别结果, 否则跳转回步骤二, 继续 考虑第N+1个领域。 2.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 获取语 义向量的方法包括: 基于深度学习的语义编码方法。 3.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 步骤二 中, 按顺序考虑领域的方法包括, 对于非首轮语句, 将上一轮语句的领域作为首要考虑领 域。 4.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 构建语 句补全模型的方法包括: Seq2Seq模型或Po inter‑Generator Networks模型。 5.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 构建所 述语句补全 模型后, 还 包括设定损失函数, 以及设定迭代更新所述语句补全 模型的参数。 6.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 语句补 全模型的训练方法包含: 获取语料数据, 根据实际需求对语料中的文本进 行处理, 将处理后 的文本转换为语义向量, 将所述语义向量输入语句补全模型进行训练, 得到训练好的语句 补全模型。 7.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 构建有 效性判定模型的方法包括: 基于深度学习的分类模型 方法。 8.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 构建所 述有效性判定模型后, 还包括设定损失函数, 以及设定迭代更新所述有效性判定模型 的参 数。 9.根据权利要求1所述的基于语句补全的多轮对话领域识别方法, 其特征在于, 有效性 判定模型的训练方法包含: 获取语料数据, 根据实际需求对语料中的文本进行 处理, 将处理 后的文本转换为语义向量, 将所述语义向量输入有效性判定模型进行训练, 得到训练好的 有效性判定模型。 10.一种基于语句补全的多轮对话领域识别装置, 其特 征在于, 包括: 语义编码单 元, 用于将历史对话语料和每 个领域转换为语义向量; 语句补全单元, 用于将第N个领域的语义向量和历史语料的语义向量输入到语句补全 模型, 得到补全后的句子; 有效性判定单元, 用于将第 N个领域补全后的句子输入到有 效性判定模型, 若判定为有 效, 第N个领域即为识别结果, 否则跳转回语句补全单 元, 继续考虑第N+1个领域。权 利 要 求 书 1/1 页 2 CN 114328876 A 2一种基于语句补全的多轮对话领域识别方 法和装置 技术领域 [0001]本发明涉及自然语言处理和深度学习技术领域, 尤其涉及一种基于语句补全的多 轮对话领域识别方法和装置 。 背景技术 [0002]从人工智能研究的初期开始, 人们就致力于开发高度智能化的人机对话系统。 艾 伦·图灵(Alan Turing)在1950年提出图灵测试, 认为如果人类无法区分和他对话交谈的 是机器还 是人类, 那么就可以说机器通过了图灵测试, 拥有高度的智能。 随着信息技术和自 然语言处理技术的不断发展, 人机对话系统初步地应用在智能客服、 智能音箱 等场景, 人们 的期望也逐渐从单 领域单轮的对话系统变为多领域多轮的对话系统。 [0003]在多领域多轮的对话系统中, 第一步就是领域识别。 聊天计算机获取用户的输入, 将其正确 地分类到相应的领域, 然后再基于该领域开展后续任务。 所以领域识别的准确 性 直接决定 了整个对话系统的服 务质量。 [0004]一种思路是只基于当前轮语句来识别领域。 较早的方法利用领域的先验知识或模 板来识别, 后来有了基于统计方法的分类模型。 随着深度学习技术的发展, 还出现了卷积神 经网络、 循环神经网络、 fastText等分类模型。 然而这些方法没有利用历史信息, 无法处理 用户回复省略句的情况。 [0005]另外一种思路是将历史语句和当前轮语句的特征 融合在一起作为输入, 训练分类 模型。 然而当历史语句和当前轮语句的领域不一致时, 历史语句完全变成了干扰信息, 很大 地影响了 分类的准确性。 这种情况下, 可能需要用户反 复强调才能成功切换领域, 很影响用 户体验。 [0006]综上所述, 现有领域识别模型存在以下几点问题: [0007](1)、 基于单轮的领域识别模型只利用了当前轮信息, 没有利用历史信息, 模型的 灵活性不高, 无法处 理实际对话中用户经常回复省略句的情况。 [0008](2)、 一些利用了历史信息的领域识别模型, 只是单纯地将历史信息和当前轮信息 合在一起, 没有考虑到在领域切换时历史信息含有干扰信息, 模型的准确率较低。 发明内容 [0009]本发明提供了一种基于语句补全的多轮对话领域识别方法和装置, 以解决上述技 术问题。 [0010]本发明采用的技术方案是: 提供一种基于语句补全的多轮对话领域识别方法, 包 括: [0011]步骤一, 将历史对话语料和每 个领域转换为语义向量; [0012]步骤二, 按顺序考虑第N个领域, 将该领域的语义向量和历史语料的语义向量输入 到语句补全 模型, 得到补全后的句子; [0013]步骤三, 将第N个领域补全后的句子输入到有效性判定模型, 若判定为有效, 第N个说 明 书 1/4 页 3 CN 114328876 A 3
专利 一种基于语句补全的多轮对话领域识别方法和装置
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:47:55
上传分享
举报
下载
原文档
(454.1 KB)
分享
友情链接
DB51-T 3050-2023 四川省行政执法案件编号规则 四川省.pdf
GB-T 40087-2021 地球空间网格编码规则.pdf
ISO 19160-4 2023 Addressing — Part 4 International postal address components and template.pdf
R155f.pdf
SL-T 171-2020 堤防工程管理设计规范.pdf
ISO IEC 2382-37 022 Information technology — Vocabulary — Part 37 Biometrics.pdf
民航 MH-T 1076.1-2023 民航旅客行李全流程跟踪系统 第1部分:机场端建设规范.pdf
GB-T 38146.2-2019 中国汽车行驶工况 第2部分:重型商用车辆.pdf
GB-T 23022-2022 信息化和工业化融合管理体系 生产设备运行管理规范.pdf
GB-T 39559.4-2020 城市轨道交通设施运营监测技术规范 第4部分:轨道和路基.pdf
ISO-IEC 27007 英文版 2022.pdf
GB-T 11436-2012 软磁铁氧体材料成品、半成品化学分析方法.pdf
GB-T 28827.7-2022 信息技术服务 运行维护 第7部分:成本度量规范.pdf
法律法规 证券期货行政执法当事人承诺制度实施办法.pdf
T-ZLDX 001—2023 中国老年大学 学校 “游学养”建设与 评价规范.pdf
GB-T 26527-2011 有机硅消泡剂.pdf
GB-T 22360-2008 真空泵 安全要求.pdf
NB-T 10605—2021 水电工程建设征地企业处理规划设计规范.pdf
GB-T 34946-2017 C#语言源代码漏洞测试规范.pdf
GB-T 42916-2023 铝及铝合金产品标识.pdf
1
/
3
7
评价文档
赞助2元 点击下载(454.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。