团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111658530.1 (22)申请日 2021.12.31 (71)申请人 展讯通信 (上海) 有限公司 地址 201203 上海市浦东 新区自由贸易试 验区祖冲之 路2288弄展讯中心1号楼 (72)发明人 张维城 (74)专利代理 机构 北京汇思诚业知识产权代理 有限公司 1 1444 代理人 汪源 (51)Int.Cl. G10L 15/02(2006.01) G10L 15/22(2006.01) G10L 17/02(2013.01) G10L 25/27(2013.01) G06N 3/08(2006.01) (54)发明名称 一种语音识别方法、 装置、 存储介质和电子 设备 (57)摘要 本发明实施例提供了一种语音识别方法、 装 置、 存储介质和电子设备。 该方法包括: 接收用户 输入的语音命令; 提取语音命令的语音中介特征 值; 通过深度学习算法判断语音中介特征值是否 对应于存储的注册命令; 若判断出语音中介特征 值对应于存储的注册命令, 通过深度学习算法判 断语音中介特征值是否对应于存储的注册语音 特征; 若判断出语音中介特征值对应于存储的注 册语音特征, 则识别出用户的语音。 本发明实施 例提供的技术方案中, 整合了语音启动检测和声 纹识别检测, 减少了语音识别所需的计算空间资 源和储存空间资源, 提高了 语音识别的效率。 权利要求书2页 说明书8页 附图4页 CN 114267336 A 2022.04.01 CN 114267336 A 1.一种语音识别方法, 其特 征在于, 包括: 接收用户输入的语音命令; 提取所述语音命令的语音中介特 征值; 通过深度学习算法判断所述语音中介特 征值是否对应于存 储的注册命令; 若判断出所述语音中介特征值对应于存储的注册命令, 通过深度 学习算法判断所述语 音中介特 征值是否对应于存 储的注册语音特 征; 若判断出 所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 2.根据权利要求1所述的方法, 其特 征在于, 所述接收用户输入的语音命令之前包括: 接收用户输入的多个注 册命令; 提取每个所述注 册命令的注 册中介特 征值; 判断多个所述注 册命令的数量是否等于设定阈值; 若判断出多个所述注册命令的数量等于设定阈值, 根据多个所述注册中介特征值生成 注册语音特 征; 存储所述注 册语音特 征。 3.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册命令, 继续执行所述接收用户输入 的语音命令的步骤。 4.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册语音特征, 继续执行所述接收用户 输入的语音命令的步骤。 5.根据权利要求2所述的方法, 其特 征在于, 还 包括: 若判断出多个所述注册命令的数量小于设定阈值, 则存储多个所述注册中介特征值, 并继续执 行所述接收用户输入的多个注 册命令的步骤。 6.根据权利要求1所述的方法, 其特征在于, 所述语音中介特征值包括频谱特征值, 所 述提取所述语音命令的语音中介特 征值, 包括: 提取所述语音命令的频谱特 征值; 根据所述频谱特 征值生成第一 梅尔频谱特 征值和第二 梅尔频谱特 征值。 7.根据权利要求6所述的方法, 其特征在于, 所述通过深度 学习算法判断所述语音中介 特征值是否对应于存 储的注册命令, 包括: 通过深度学习算法判断所述第一 梅尔频谱特 征值是否对应于存 储的注册命令; 所述通过深度 学习算法判断所述语音中介特征值是否对应于存储的注册语音特征, 包 括: 通过深度学习算法判断所述第二 梅尔频谱特 征值是否对应于存 储的注册语音特 征。 8.一种语音识别装置, 其特 征在于, 包括: 接收模块, 用于 接收用户输入的语音命令; 第一提取模块, 用于提取 所述语音命令的语音中介特 征值; 第一判断模块, 用于通过深度 学习算法判断所述语音中介特征值是否对应于存储的注 册命令; 第二判断模块, 用于第 一判断模块若判断出所述语音中介特征值对应于存储的注册命权 利 要 求 书 1/2 页 2 CN 114267336 A 2令, 通过深度学习算法判断所述语音中介特征值是否对应于存储的注册语音特征; 若判断 出所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 9.一种存储介质, 其特征在于, 包括: 所述存储介质包括存储的程序, 其中, 在所述程序 运行时控制所述存 储介质所在设备 执行权利要求1至7任意 一项所述的一种语音识别方法。 10.一种电子设备, 包括存储器和 处理器, 所述存储器用于存储包括程序指令的信息, 所述处理器用于控制程序指令的执行, 其特征在于, 所述程序指令被处理器加载并执行时 实现权利要求1至7任意 一项所述的一种语音识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 114267336 A 3
专利 一种语音识别方法、装置、存储介质和电子设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:49:02
上传分享
举报
下载
原文档
(614.4 KB)
分享
友情链接
GB-T 35121-2017 全程供应链管理服务平台参考功能框架.pdf
GB-T 28905-2022 建筑用低屈服强度钢板.pdf
南京市民用建筑节能条例.pdf
DB3701-T 0005.8—2019 济南市公共服务领域名称英文译写规范 第8部分:体育 济南市.pdf
NY-T 3223-2018 日光温室设计规范.pdf
T-CEC 5072—2022 抽水蓄能电站高压压水试验规程.pdf
GB-T 23799-2021 车用甲醇汽油 M85.pdf
贵州省大数据安全保障条例.pdf
GB-T 2847-2005 用于水泥中的火山灰质混合材料.pdf
YD-T 2698-2014 电信网和互联网安全防护基线配置要求及检测要求 网络设备.pdf
NIST 特别出版物 800 安全软件开发框架 (SSDF) 1.1 版:降低软件漏洞风险的建议o.pdf
T-CPUMT 008—2022 工业信息安全漏洞分类分级指南.pdf
成本分析.xls
GB-T 37673-2019 煤灰中硅、铝、铁、钙、镁、钠、钾、磷、钛、锰、钡、锶的测定 X射线荧光光谱法.pdf
GB-T 41263-2022 工控系统动态重构主动防御体系架构规范.pdf
GB-T 20204-2006 水利水文自动化系统设备检验测试通用技术规范.pdf
GoogleCloud 自动化安全运营中心soc建设指南 OfficeofCISO AutonomicSecurityOperations 10x 英文 .pdf
GB-T 34079.5-2021 基于云计算的电子政务公共平台服务规范 第5部分:移动服务.pdf
GB-T 43558-2023 全国一体化政务服务平台移动端规范.pdf
GB-T 24718-2023 防眩板.pdf
1
/
3
15
评价文档
赞助2元 点击下载(614.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。