首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于麦克风阵列会议设备的语音识别方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门亿联网络技术股份有限公司

摘要:本申请涉及智能语音交互技术领域,公开了一种用于麦克风阵列会议设备的语音识别方法及装置,其方法包括获取任一单通道的输入音频;采用预设的3A模型对输入音频进行频带建模,融合提取的特征,经过复数网络计算,得到一个掩码作用于输入音频以得到目标音频;将目标音频输入预设的语音唤醒模型,确定唤醒词的音频段;判断是否存在人声;若存在人声,则利用预设的提取模型提取唤醒人声纹特征,确定唤醒人的音频段;将当前帧的唤醒人的音频段输入预设的人声识别模型进行人声指令识别,得到唤醒人的人声指令,通过语言模型识别人声指令对应的意图,并响应唤醒人的人声指令。本申请具有在会议室多人讲话的场景下,改善人声指令和唤醒词识别精度的效果。

主权项:1.一种用于麦克风阵列会议设备的语音识别方法,其特征在于,包括以下步骤,获取任一单通道的待识别语音数据,得到输入音频;采用预设的3A模型对所述输入音频进行降噪处理,得到目标音频;所述3A模型对所述输入音频进行频带建模,融合提取的特征,经过复数网络计算,得到一个掩码,所述掩码作用于所述输入音频以得到目标音频;将所述目标音频输入预设的语音唤醒模型,输出是否存在唤醒词及所述唤醒词的唤醒率,确定唤醒词的音频段;根据所述唤醒词的音频段,判断是否存在人声;若存在人声,则利用预设的提取模型提取存在人声的所述唤醒词的音频段中的唤醒人声纹特征,判断当前帧是否为唤醒人的声音,确定唤醒人的音频段;将当前帧的所述唤醒人的音频段输入预设的人声识别模型进行人声指令识别,得到唤醒人的人声指令,通过语言模型识别人声指令对应的意图,并响应所述唤醒人的人声指令。

全文数据:

权利要求:

百度查询: 厦门亿联网络技术股份有限公司 一种用于麦克风阵列会议设备的语音识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。