首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种嘈杂环境下鲁棒的声纹消杂和识别系统及装置_杭州屋屋科技有限公司_202410207585.8 

申请/专利权人:杭州屋屋科技有限公司

申请日:2024-02-26

公开(公告)日:2024-05-17

公开(公告)号:CN118053431A

主分类号:G10L17/02

分类号:G10L17/02;G10L17/18;G10L17/04;G10L21/0216

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.04#实质审查的生效;2024.05.17#公开

摘要:本发明涉及语音信号处理技术领域,具体而言,涉及一种嘈杂环境下鲁棒的声纹消杂系统,包括:d‑vector模块和噪声音频频谱图,所述d‑vector模块输入端连接输入目标说话人语音增强网络,所述噪声音频频谱图输入端输入经第一短时傅里叶变换处理的噪声音频,且所述d‑vector模块和所述噪声音频频谱图输出端连接可训练的语音过滤器,所述可训练的语音过滤器输出的语音通过软掩蔽预模块和逆向短时傅里叶变换处理后得到增强音频。通过设备的整体结构,创造性的提出了先进行语音增强,消除背景的各种噪声和干扰人声,然后再通过基于深度学习的声纹识别系统进行声纹识别,大大提高了声纹识别在背景嘈杂时的系统鲁棒性,且大大提高声纹在嘈杂环境的声纹识别准确率。

主权项:1.一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于,包括:d-vector模块和噪声音频频谱图,所述d-vector模块输入端连接输入目标说话人语音增强网络,所述噪声音频频谱图输入端输入经第一短时傅里叶变换处理的噪声音频,且所述d-vector模块和所述噪声音频频谱图输出端连接可训练的语音过滤器,所述可训练的语音过滤器输出的语音通过软掩蔽预模块和逆向短时傅里叶变换处理后得到增强音频;所述软掩蔽预模块处理后得到预测的掩蔽后的频谱图,所述预测的掩蔽后的频谱图还连接训练期间计算模块。

全文数据:

权利要求:

百度查询: 杭州屋屋科技有限公司 一种嘈杂环境下鲁棒的声纹消杂和识别系统及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。