团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111658530.1 (22)申请日 2021.12.31 (71)申请人 展讯通信 (上海) 有限公司 地址 201203 上海市浦东 新区自由贸易试 验区祖冲之 路2288弄展讯中心1号楼 (72)发明人 张维城 (74)专利代理 机构 北京汇思诚业知识产权代理 有限公司 1 1444 代理人 汪源 (51)Int.Cl. G10L 15/02(2006.01) G10L 15/22(2006.01) G10L 17/02(2013.01) G10L 25/27(2013.01) G06N 3/08(2006.01) (54)发明名称 一种语音识别方法、 装置、 存储介质和电子 设备 (57)摘要 本发明实施例提供了一种语音识别方法、 装 置、 存储介质和电子设备。 该方法包括: 接收用户 输入的语音命令; 提取语音命令的语音中介特征 值; 通过深度学习算法判断语音中介特征值是否 对应于存储的注册命令; 若判断出语音中介特征 值对应于存储的注册命令, 通过深度学习算法判 断语音中介特征值是否对应于存储的注册语音 特征; 若判断出语音中介特征值对应于存储的注 册语音特征, 则识别出用户的语音。 本发明实施 例提供的技术方案中, 整合了语音启动检测和声 纹识别检测, 减少了语音识别所需的计算空间资 源和储存空间资源, 提高了 语音识别的效率。 权利要求书2页 说明书8页 附图4页 CN 114267336 A 2022.04.01 CN 114267336 A 1.一种语音识别方法, 其特 征在于, 包括: 接收用户输入的语音命令; 提取所述语音命令的语音中介特 征值; 通过深度学习算法判断所述语音中介特 征值是否对应于存 储的注册命令; 若判断出所述语音中介特征值对应于存储的注册命令, 通过深度 学习算法判断所述语 音中介特 征值是否对应于存 储的注册语音特 征; 若判断出 所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 2.根据权利要求1所述的方法, 其特 征在于, 所述接收用户输入的语音命令之前包括: 接收用户输入的多个注 册命令; 提取每个所述注 册命令的注 册中介特 征值; 判断多个所述注 册命令的数量是否等于设定阈值; 若判断出多个所述注册命令的数量等于设定阈值, 根据多个所述注册中介特征值生成 注册语音特 征; 存储所述注 册语音特 征。 3.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册命令, 继续执行所述接收用户输入 的语音命令的步骤。 4.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若判断出所述语音中介特征值未对应于存储的注册语音特征, 继续执行所述接收用户 输入的语音命令的步骤。 5.根据权利要求2所述的方法, 其特 征在于, 还 包括: 若判断出多个所述注册命令的数量小于设定阈值, 则存储多个所述注册中介特征值, 并继续执 行所述接收用户输入的多个注 册命令的步骤。 6.根据权利要求1所述的方法, 其特征在于, 所述语音中介特征值包括频谱特征值, 所 述提取所述语音命令的语音中介特 征值, 包括: 提取所述语音命令的频谱特 征值; 根据所述频谱特 征值生成第一 梅尔频谱特 征值和第二 梅尔频谱特 征值。 7.根据权利要求6所述的方法, 其特征在于, 所述通过深度 学习算法判断所述语音中介 特征值是否对应于存 储的注册命令, 包括: 通过深度学习算法判断所述第一 梅尔频谱特 征值是否对应于存 储的注册命令; 所述通过深度 学习算法判断所述语音中介特征值是否对应于存储的注册语音特征, 包 括: 通过深度学习算法判断所述第二 梅尔频谱特 征值是否对应于存 储的注册语音特 征。 8.一种语音识别装置, 其特 征在于, 包括: 接收模块, 用于 接收用户输入的语音命令; 第一提取模块, 用于提取 所述语音命令的语音中介特 征值; 第一判断模块, 用于通过深度 学习算法判断所述语音中介特征值是否对应于存储的注 册命令; 第二判断模块, 用于第 一判断模块若判断出所述语音中介特征值对应于存储的注册命权 利 要 求 书 1/2 页 2 CN 114267336 A 2令, 通过深度学习算法判断所述语音中介特征值是否对应于存储的注册语音特征; 若判断 出所述语音中介特 征值对应于存 储的注册语音特 征, 则识别出用户的语音。 9.一种存储介质, 其特征在于, 包括: 所述存储介质包括存储的程序, 其中, 在所述程序 运行时控制所述存 储介质所在设备 执行权利要求1至7任意 一项所述的一种语音识别方法。 10.一种电子设备, 包括存储器和 处理器, 所述存储器用于存储包括程序指令的信息, 所述处理器用于控制程序指令的执行, 其特征在于, 所述程序指令被处理器加载并执行时 实现权利要求1至7任意 一项所述的一种语音识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 114267336 A 3
专利 一种语音识别方法、装置、存储介质和电子设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:49:02
上传分享
举报
下载
原文档
(614.4 KB)
分享
友情链接
T-ZSFX 007—2020 中山装工业化生产技术规范.pdf
GB-T 16553-2017 珠宝玉石 鉴定.pdf
2021年数据安全法律手册-完整版.pdf
GB-T 3324-2017 木家具通用技术条件.pdf
DB35-T 1771-2018 印度豇豆栽培与利用技术规范 福建省.pdf
GB-T 23999-2009 室内装饰装修用水性木器涂料.pdf
DB52-T 1041-2015 贵州省红粘土和高液限土路基设计与施工技术规范 贵州省.pdf
GB-T 13861-2022 生产过程危险和有害因素分类与代码.pdf
GB-T 19465-2004 工业用异丁烷 (HC-600a).pdf
全国计算机技术与软件专业技术资格 水平 考试 2023年材料.pdf
专利 一种温控器.PDF
GB-T 5048-2017 防潮包装.pdf
GB-T 18771.2-2015 烟草术语 第2部分:烟草制品与烟草加工.pdf
DB3205-T 1083-2023 医疗机构数据安全管理规范 苏州市.pdf
中国电信 数字道路白皮书 2022.pdf
GB-T 18107-2017 红木.pdf
QC-T 556-2023 汽车制动器温度测量方法及热电偶安装要求.pdf
T-WSJD 29—2022 化妆品安全评估 毒理学关注阈值法.pdf
T-SLIA 001—2019 食品接触材料及制品、饰品 表面积的测定 三维模型重建法.pdf
DB45-T 2761-2023 电子政务外网运维管理规范 广西壮族自治区.pdf
1
/
3
15
评价文档
赞助2元 点击下载(614.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。