恭喜安徽大学范存航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜安徽大学申请的专利结合声学特征和状态空间模型的语音分离方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119360878B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411897514.1,技术领域涉及:G10L21/0308;该发明授权结合声学特征和状态空间模型的语音分离方法及系统是由范存航;项旺;吕钊;李心慧设计研发完成,并于2024-12-23向国家知识产权局提交的专利申请。
本结合声学特征和状态空间模型的语音分离方法及系统在说明书摘要公布了:本发明涉及语音分离技术领域,具体涉及结合声学特征和状态空间模型的语音分离方法及系统。本发明为了实现语音分离提供了一种语音分离模型,其首先通过音频编码部对混合语音Voicemix进行编码以得到N种不同分辨率的音频特征{F1~FN},接着通过声学特征提取部基于{F1~FN}提取出多尺度语音特征G'm,然后通过状态空间网络部对G'm进行长期建模以得到长时特征IT,out,最后通过音频解码部结合{F1~FN}与IT,out解码重构出{Voice1,…,VoiceN}。本发明解决了现有语音分离方法面对长序列音频会出现建模局限而影响语音分离性能的问题。
本发明授权结合声学特征和状态空间模型的语音分离方法及系统在权利要求书中公布了:1.一种结合声学特征和状态空间模型的语音分离方法,包括:步骤一,获取混合语音Voicemix;其特征在于,还包括:步骤二,采用训练好的语音分离模型对Voicemix进行处理,得到N个分离后的语音{Voice1,…,VoiceN};N>1;其中,语音分离模型包括:音频编码部,用于对Voicemix进行编码以得到N种不同分辨率的音频特征{F1~FN};声学特征提取部,用于基于{F1~FN}提取出多尺度语音特征G'm;状态空间网络部,用于对G'm进行长期建模以得到长时特征IT,out;音频解码部,用于结合{F1~FN}与IT,out解码重构出{Voice1,…,VoiceN};状态空间网络部包括:M个IndBiMamba层;M≥1;前一个IndBiMamba层的输出作为后一个IndBiMamba层的输入;IndBiMamba层包括:2个线性层、1个反转层、1个激活函数层、2个Backward-SSM层、2个乘积层、1个叠加层;在任一个IndBiMamba层中,第1个线性层对该IndBiMamba层的输入Input进行线性投影处理以得到中间特征IT;反转层对IT进行序列顺序的反转以得到中间特征I'T;激活函数层对中间特征IT进行转换以得到中间特征Id;第1个Backward-SSM层对IT进行长期建模以得到中间特征IT,f;第2个Backward-SSM层对I'T进行长期建模以得到中间特征IT,b;第1个乘积层将IT,f、Id进行乘积处理;第2个乘积层将IT,b、Id进行乘积处理;叠加层将第1个乘积层的输出、第2个乘积层的输出进行叠加;第2个线性层对叠加层的输出进行线性投影处理以得到该IndBiMamba层的输出Output;第1个IndBiMamba层的输入Input为G'm;第M个IndBiMamba层的输出Output为IT,out。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经开区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。