恭喜东南大学杨云雁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东南大学申请的专利基于多尺度特征通道融合的多通道语音分离方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119252272B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411765064.0,技术领域涉及:G10L21/0272;该发明授权基于多尺度特征通道融合的多通道语音分离方法及设备是由杨云雁;周琳;包浩辰;庄程浩设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。
本基于多尺度特征通道融合的多通道语音分离方法及设备在说明书摘要公布了:本发明公开了一种基于多尺度特征通道融合的多通道语音分离方法及设备,方法包括:获取若干具有不同噪声、混响和说话人的多通道混合语音信号形成训练数据集;构建基于多尺度特征通道融合的多通道语音分离网络,具体包括高维特征提取模块、空间特征提取模块、多尺度特征提取模块、基于特征通道融合的卷积分离网络、语音重构模块;将所述训练数据集输入所述多通道语音分离网络,进行网络训练;将待分离的含噪含混响含多个说话人的混合多通道语音信号输入训练好的多通道语音分离网络,得到各个说话人的单通道语音信号。本发明分离能力和泛化能力更强。
本发明授权基于多尺度特征通道融合的多通道语音分离方法及设备在权利要求书中公布了:1.一种基于多尺度特征通道融合的多通道语音分离方法,其特征在于,包括:步骤1、获取若干具有不同噪声、混响和说话人的多通道混合语音信号,并将对应的纯净单说话人单通道语音信号作为标签,形成训练数据集;步骤2、构建基于多尺度特征通道融合的多通道语音分离网络,具体包括:高维特征提取模块,用于提取参考通道混合语音信号的高维特征,其中,参考通道混合语音信号为多通道混合语音信号中任意一个通道上的混合语音信号;空间特征提取模块,用于提取多通道混合语音信号的通道间卷积差参数;多尺度特征提取模块,用于将所述高维特征和所述通道间卷积差参数进行多尺度的融合,得到多尺度融合特征;基于特征通道融合的卷积分离网络,用于根据多尺度融合特征计算多通道混合语音信号中每个说话人的掩码;语音重构模块,用于根据所述每个说话人的掩码和所述高维特征,重构每个说话人的纯净单通道语音信号,实现语音分离;步骤3、将所述训练数据集输入所述多通道语音分离网络,进行网络训练;步骤4、将待分离的含噪含混响含多个说话人的混合多通道语音信号输入训练好的多通道语音分离网络,得到各个说话人的单通道语音信号;所述多尺度特征提取模块包括第一尺度支路、第二尺度支路、第三尺度支路和融合支路,融合支路的输入为第一尺度支路、第二尺度支路、第三尺度支路的输出拼接后的特征,所述第一尺度支路包括依次连接的第一尺度一维卷积层、组归一化层和PReLU激活函数,所述第二尺度支路包括依次连接的第二尺度一维卷积层、组归一化层和PReLU激活函数,所述第三尺度支路包括依次连接的第三尺度一维卷积层、组归一化层和PReLU激活函数,所述融合支路包括二维卷积层、组归一化层和PReLU激活函数;所述基于特征通道融合的卷积分离网络包括依次连接的全局归一化层、一维卷积层、B个堆叠的卷积分离模块、PReLU激活函数、一维卷积层和sigmoid激活函数,其中,B个卷积分离模块具体为扩张因子依次为2b-1的卷积分离模块,b=1,…,B,B为大于1的正整数;所述卷积分离模块具体包括依次连接的第一一维卷积层、PReLU激活函数、第一全局归一化层、全局平均池化层、第二一维卷积层、全连接层、sigmoid激活函数、点乘操作、第一拼接操作、深度卷积层、第二PReLU激活函数、第二全局归一化层、第三一维卷积层和第二拼接操作,其中,所述第一全局归一化层的输出与sigmoid激活函数的输出执行所述点乘操作,所述第一全局归一化层的输出还与所述点乘操作的输出执行所述第一拼接操作,所述第一一维卷积层的输入还与所述第三一维卷积层的输出执行所述第二拼接操作,所述第二拼接操作的输出为卷积分离模块的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。