买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院声学研究所
摘要:本发明公开了一种采用级联掩蔽估计的语音分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;所述声源分离器采用级联掩蔽估计分离器;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形。本发明的方法为了进一步提高多粒度特征融合的质量和效率,以跨粒度特征融合单元为基础,通过多级细化和逐粒度融合,逐步优化多时间粒度的融合特征,从而提高了分离出的目标信号的质量。
主权项:1.一种采用级联掩蔽估计的语音分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;所述声源分离器采用级联掩蔽估计分离器;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形;所述声源分离器包括:特征提取模块、跨粒度特征级联融合模块和加法器;所述特征提取模块,用于对编码器输出的隐藏空间矩阵进行变换,产生不同时间粒度的特征,并输出至跨粒度特征级联融合模块;所述跨粒度特征级联融合模块,用于通过多级处理,逐步细化融合特征的质量;每一级处理包括“自底向上”和“自顶向下”两种操作;“自底向上”从粗粒度特征开始,逐渐融合不同尺度的细粒度特征,产生该级对目标信号的掩蔽估计;“自顶向下”将上一级的多粒度融合结果分别与本级的各粒度特征进行融合,并将此作为本级的输入;所述加法器,用于对每一级和各粒度的掩蔽估计进行加权平均,产生最终的掩蔽矩阵。
全文数据:
权利要求:
百度查询: 中国科学院声学研究所 一种采用级联掩蔽估计的语音分离方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。