首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种混响环境下基于注意力加权的多通道语音分离方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:桂林电子科技大学

摘要:本发明公开了一种混响环境下基于注意力加权的多通道语音分离方法,首先,利用多通道麦克风阵列收集混合语言;其次,对各个麦克风收集到的语音进行快速傅里叶变换得到混合语音信号时频谱,分别取各个通道语音信号的频域相位信息获得通道间相位差特征;然后引入自注意力机制的思想,采用打分加权的方式,对多组通道间相位差进行特征融合,与其它形式的特征拼接组成输入特征;最后将输入特征送入当下流行的时域卷积网络系统模型中迭代训练,得到语音分离模型。该方法采用加权打分的方式,解决了麦克风通道浪费的问题,尽可能多的使用通道间相位差,减少了语音信号空间信息的损失,使得语音分离性能得到了提升。

主权项:1.一种混响环境下基于注意力加权的多通道语音分离方法,其特征在于,包括以下步骤:S1、利用多通道麦克风阵列收集混合语言;S2、对收集到的多通道混合语音进行快速傅里叶变换,得到混合语音信号时频谱Yt,f;S3、对时频谱进行特征处理,获得对数功率谱特征LPS、通道间相位差特征IPD;以及方向特征dθt,f;S4、对多路通道间相位差特征进行注意力加权,加权以后与获得的对数功率谱特征和方向特征进行拼接得到输入特征Infeature;S5、将输入特征Infeature送入时域卷积网络模型获得目标语音分离MaskTCN,并将MaskTCN与混合语言时频谱Yt,f点积获得估计语音的时频谱;S6、估计语音的时频谱经过反傅里叶变换得到估计语音st,并与参考语言计算等比信噪比损失进行反向传播,迭代学习,最终获得语音分离模型,通过语言分离模型将估计语言从混合语音中分离出来。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种混响环境下基于注意力加权的多通道语音分离方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。