恭喜上海灵境声学技术股份有限公司谭波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海灵境声学技术股份有限公司申请的专利一种音频降噪系统、降噪方法及车载音频系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119400197B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510006612.X,技术领域涉及:G10L21/0224;该发明授权一种音频降噪系统、降噪方法及车载音频系统是由谭波;刘少鹏设计研发完成,并于2025-01-03向国家知识产权局提交的专利申请。
本一种音频降噪系统、降噪方法及车载音频系统在说明书摘要公布了:本发明公开了一种音频降噪系统、降噪方法及车载音频系统,降噪系统包括输入音频预处理模块,其对输入的音频信号进行预处理,以生成音频频谱;深度神经网络分离模块,其配置有:特征提取层,其从音频频谱中提取音频特征,即时间特征和频率特征;编码器,用于压缩特征提取层输出的音频特征,并根据音频特征生成潜在空间表示;解码器,根据潜在空间表示对人声与噪声进行重建与分离;自适应掩模生成器,其根据噪声与人声之间的频率差异,结合时间特征,生成时序性的频谱掩码,以将人声音频分离出来;输出重建模块,其被配置为对分离出来的人声音频信号的频率特征进行逆变换,以重建得到时域音频数据,能够适应不同噪声类型,避免语音失真或被误抑制。
本发明授权一种音频降噪系统、降噪方法及车载音频系统在权利要求书中公布了:1.一种音频降噪系统,其特征在于,包括以下模块:输入音频预处理模块,其被配置为对输入的音频信号进行预处理,以生成音频频谱;深度神经网络分离模块,其配置有:特征提取层,其从所述音频频谱中提取音频特征,所述音频特征包括时间特征和频率特征;编码器解码器架构,该架构的编码器用于压缩所述特征提取层输出的音频特征,并根据所述音频特征生成潜在空间表示,该架构的解码器根据所述潜在空间表示对人声与噪声进行重建与分离;自适应掩模生成器,其根据噪声与人声之间的频率差异,结合时间特征,生成时序性的频谱掩码,以将人声音频分离出来;输出重建模块,其被配置为对分离出来的人声音频信号的频率特征进行逆变换,以重建得到时域音频数据;其中,所述深度神经网络分离模块通过以下步骤训练得到:收集多个噪声音频,生成对应的噪声音频频谱,并根据所述噪声音频频谱的谱图标注其所属的噪声类型;及收集多个人声音频,并生成对应的人声音频频谱;将噪声音频与人声音频混合得到混合音频,并生成对应的混合音频频谱;以所述混合音频和混合音频频谱作为学习样本,以所述噪声音频频谱、噪声类型的标注及人声音频频谱作为样本的标签;利用收集的多个学习样本及对应的标签对卷积神经网络或递归神经网络进行训练;所述卷积神经网络或递归神经网络执行以下运算:将每一个学习样本分割成多个音频帧,每个音频帧具有相同数量的通道;对每一个音频帧生成特征向量,所述特征向量包括音频帧的各个通道的值;基于所述特征向量,估计该音频帧中人声音频频谱与噪声音频频谱的瞬时函数;根据该样本的标签中的噪声音频频谱和人声音频频谱,计算人声音频频谱与噪声音频频谱的基准瞬时函数;根据每个音频帧的时间长度和相邻音频帧之间的偏移时间长度,确定基准瞬时函数的离散点;以离散点处的基准瞬时函数为目标,优化所述卷积神经网络或递归神经网络的权重,使估计得到的瞬时函数与对应离散点处的基准瞬时函数之间的差距减小。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海灵境声学技术股份有限公司,其通讯地址为:200125 上海市浦东新区东方路3601号7号楼五层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。