团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111658530.1 (22)申请日 2021.12.31 (71)申请人 展讯通信 (上海) 有限公司 地址 201203 上海市浦东 新区自由贸易试 验区祖冲之 路2288弄展讯中心1号楼 (72)发明人 张维城  (74)专利代理 机构 北京汇思诚业知识产权代理 有限公司 1 1444 代理人 汪源 (51)Int.Cl. G10L 15/02(2006.01) G10L 15/22(2006.01) G10L 17/02(2013.01) G10L 25/27(2013.01) G06N 3/08(2006.01) (54)发明名称 一种语音识别方法、 装置、 存储介质和电子 设备 (57)摘要 本发明实施例提供了一种语音识别方法、 装 置、 存储介质和电子设备。 该方法包括: 接收用户 输入的语音命令; 提取语音命令的语音中介特征 值; 通过深度学习算法判断语音中介特征值是否 对应于存储的注册命令; 若判断出语音中介特征 值对应于存储的注册命令, 通过深度学习算法判 断语音中介特征值是否对应于存储的注册语音 特征; 若判断出语音中介特征值对应于存储的注 册语音特征, 则识别出用户的语音。 本发明实施 例提供的技术方案中, 整合了语音启动检测和声 纹识别检测, 减少了语音识别所需的计算空间资 源和储存空间资源, 提高了 语音识别的效率。 权利要求书2页 说明书8页 附图4页 CN 114267336 A 2022.04.01 CN 114267336 A 1.一种语音识别方法, 其特 征在于, 包括: 接收用户输入的语音命令; 提取所述语音命令的语音中介特 征值; 通过深度学习算法判断所述语音中介特 征值是否对应于存 储的注册命令; 若判断出所述语音中介特征值对应于存储的注册命令, 通过深度 学习算法判断所述语 音中介特 征值是否对应于存 储的注册语音特 征; 若判断出 所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 2.根据权利要求1所述的方法, 其特 征在于, 所述接收用户输入的语音命令之前包括: 接收用户输入的多个注 册命令; 提取每个所述注 册命令的注 册中介特 征值; 判断多个所述注 册命令的数量是否等于设定阈值; 若判断出多个所述注册命令的数量等于设定阈值, 根据多个所述注册中介特征值生成 注册语音特 征; 存储所述注 册语音特 征。 3.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册命令, 继续执行所述接收用户输入 的语音命令的步骤。 4.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册语音特征, 继续执行所述接收用户 输入的语音命令的步骤。 5.根据权利要求2所述的方法, 其特 征在于, 还 包括: 若判断出多个所述注册命令的数量小于设定阈值, 则存储多个所述注册中介特征值, 并继续执 行所述接收用户输入的多个注 册命令的步骤。 6.根据权利要求1所述的方法, 其特征在于, 所述语音中介特征值包括频谱特征值, 所 述提取所述语音命令的语音中介特 征值, 包括: 提取所述语音命令的频谱特 征值; 根据所述频谱特 征值生成第一 梅尔频谱特 征值和第二 梅尔频谱特 征值。 7.根据权利要求6所述的方法, 其特征在于, 所述通过深度 学习算法判断所述语音中介 特征值是否对应于存 储的注册命令, 包括: 通过深度学习算法判断所述第一 梅尔频谱特 征值是否对应于存 储的注册命令; 所述通过深度 学习算法判断所述语音中介特征值是否对应于存储的注册语音特征, 包 括: 通过深度学习算法判断所述第二 梅尔频谱特 征值是否对应于存 储的注册语音特 征。 8.一种语音识别装置, 其特 征在于, 包括: 接收模块, 用于 接收用户输入的语音命令; 第一提取模块, 用于提取 所述语音命令的语音中介特 征值; 第一判断模块, 用于通过深度 学习算法判断所述语音中介特征值是否对应于存储的注 册命令; 第二判断模块, 用于第 一判断模块若判断出所述语音中介特征值对应于存储的注册命权 利 要 求 书 1/2 页 2 CN 114267336 A 2令, 通过深度学习算法判断所述语音中介特征值是否对应于存储的注册语音特征; 若判断 出所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 9.一种存储介质, 其特征在于, 包括: 所述存储介质包括存储的程序, 其中, 在所述程序 运行时控制所述存 储介质所在设备 执行权利要求1至7任意 一项所述的一种语音识别方法。 10.一种电子设备, 包括存储器和 处理器, 所述存储器用于存储包括程序指令的信息, 所述处理器用于控制程序指令的执行, 其特征在于, 所述程序指令被处理器加载并执行时 实现权利要求1至7任意 一项所述的一种语音识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 114267336 A 3

.PDF文档 专利 一种语音识别方法、装置、存储介质和电子设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语音识别方法、装置、存储介质和电子设备 第 1 页 专利 一种语音识别方法、装置、存储介质和电子设备 第 2 页 专利 一种语音识别方法、装置、存储介质和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:49:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。