北京建筑大学周若华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京建筑大学申请的专利一种音频分离方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118486322B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410803397.1,技术领域涉及:G10L21/0272;该发明授权一种音频分离方法、装置、电子设备及存储介质是由周若华;刘博伟设计研发完成,并于2024-06-20向国家知识产权局提交的专利申请。
本一种音频分离方法、装置、电子设备及存储介质在说明书摘要公布了:本申请提供了一种音频分离方法、装置、电子设备及存储介质,音频分离方法包括:将获取到的混合音频输入至预先训练好的音频分离模型之中,对混合音频分割成多个第一子频带特征,并对多个第一子频带特征进行合并,确定出合并子频带特征;基于音频分离模型对合并子频带特征进行时序建模,得到合并子频带特征的时序特征序列,再对时序特征序列进行频带级建模,得到时序特征序列的频带特征序列;基于音频分离模型对频带特征序列进行特征处理确定出全频带掩膜特征,基于全频带掩膜特征以及混合音频,将混合音频中的目标音频分离出来。通过音频分离模型对混合音频中的目标音频进行分离,从而提高了单一音频分离的准确性以及效率。
本发明授权一种音频分离方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种音频分离方法,其特征在于,所述音频分离方法包括:将获取到的混合音频输入至预先训练好的音频分离模型之中,对所述混合音频分割成多个第一子频带特征,并对多个所述第一子频带特征进行合并,确定出合并子频带特征;基于所述音频分离模型对所述合并子频带特征进行时序建模,得到所述合并子频带特征的时序特征序列,再对所述时序特征序列进行频带级建模,得到所述时序特征序列的频带特征序列;基于所述音频分离模型对所述频带特征序列进行特征处理确定出全频带掩膜特征,基于所述全频带掩膜特征以及所述混合音频,将所述混合音频中的目标音频分离出来;所述基于所述音频分离模型对所述合并子频带特征进行时序建模,得到所述合并子频带特征的时序特征序列,包括:基于所述音频分离模型对所述合并子频带特征进行归一化处理,确定出归一化处理后的合并子频带特征;将归一化处理后的合并子频带特征输入至双向长短期记忆网络层中进行特征处理,生成第二特征;对所述第二特征进行可变形卷积处理确定出第三特征,对所述第三特征进行全连接处理生成第四特征;将所述第四特征与所述合并子频带特征进行特征相加处理,生成所述合并子频带特征的时序特征序列;其中,对所述时序特征序列进行频带级建模的处理过程与上述对所述合并子频带特征进行时序建模的处理过程相一致。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京建筑大学,其通讯地址为:100000 北京市西城区展览路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。