一种混响环境下基于注意力加权的多通道语音分离方法

导航：龙图腾网> 最新专利技术> 一种混响环境下基于注意力加权的多通道语音分离方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：桂林电子科技大学

摘要：本发明公开了一种混响环境下基于注意力加权的多通道语音分离方法，首先，利用多通道麦克风阵列收集混合语言；其次，对各个麦克风收集到的语音进行快速傅里叶变换得到混合语音信号时频谱，分别取各个通道语音信号的频域相位信息获得通道间相位差特征；然后引入自注意力机制的思想，采用打分加权的方式，对多组通道间相位差进行特征融合，与其它形式的特征拼接组成输入特征；最后将输入特征送入当下流行的时域卷积网络系统模型中迭代训练，得到语音分离模型。该方法采用加权打分的方式，解决了麦克风通道浪费的问题，尽可能多的使用通道间相位差，减少了语音信号空间信息的损失，使得语音分离性能得到了提升。

主权项：1.一种混响环境下基于注意力加权的多通道语音分离方法，其特征在于，包括以下步骤：S1、利用多通道麦克风阵列收集混合语言；S2、对收集到的多通道混合语音进行快速傅里叶变换，得到混合语音信号时频谱Yt,f；S3、对时频谱进行特征处理，获得对数功率谱特征LPS、通道间相位差特征IPD；以及方向特征dθt,f；S4、对多路通道间相位差特征进行注意力加权，加权以后与获得的对数功率谱特征和方向特征进行拼接得到输入特征Infeature；S5、将输入特征Infeature送入时域卷积网络模型获得目标语音分离MaskTCN，并将MaskTCN与混合语言时频谱Yt,f点积获得估计语音的时频谱；S6、估计语音的时频谱经过反傅里叶变换得到估计语音st，并与参考语言计算等比信噪比损失进行反向传播，迭代学习，最终获得语音分离模型，通过语言分离模型将估计语言从混合语音中分离出来。

全文数据：

权利要求：

百度查询：桂林电子科技大学一种混响环境下基于注意力加权的多通道语音分离方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种组合式固定件依附锁定器

下一篇：一种组装单元体用稳态调节控制系统

相关技术

一种组合式固定件依附锁定器

一种组装单元体用稳态调节控制系统

一种水中抗分散裂缝修复注浆料及其制备方法

超临界晶圆清洗/干燥介质回收方法以及系统

一种冰孔约束下水下航行体出水试验装置及试验方法

芯片内测试电路

一种物体边沿位置的检测装置及方法

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

挖掘装置极限工况的结构优化方法、装置、设备及介质

一种用于光伏板边框的铝合金型材

牙冠的宽度数值确定方法、装置、设备及存储介质

一种飞机复合材料部件超规范修理专家系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种混响环境下基于注意力加权的多通道语音分离方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务