首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】音频信号处理方法、音频信号处理装置及存储介质_北京小米移动软件有限公司;北京小米松果电子有限公司_202110679785.X 

申请/专利权人:北京小米移动软件有限公司;北京小米松果电子有限公司

申请日:2021-06-18

公开(公告)日:2024-06-18

公开(公告)号:CN113488066B

主分类号:G10L21/0208

分类号:G10L21/0208;G10L21/0272

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2021.10.26#实质审查的生效;2021.10.08#公开

摘要:本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括:获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值,基于直达声和早期反射声的协方差矩阵估计更新值,对观测数据进行去混响处理,得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值,对多声源音频信号进行盲源分离处理,得到各声源的时域声源信号。通过本公开提供的音频信号处理方法,能够基于盲源分离算法,获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵,进而进行盲源分离得到各音频信号时,可以削弱混响声的干扰,从而提升信号分离的性能,提高音频信号的处理质量。

主权项:1.一种音频信号处理方法,其特征在于,所述音频信号处理方法包括:获取麦克风所采集的观测数据,其中,所述观测数据为多声源音频信号,所述多声源音频信号为至少两个声源发声而被所述麦克风所采集的音频信号;响应于存在直达声和早期反射声的协方差矩阵估计更新值,基于所述直达声和早期反射声的协方差矩阵估计更新值,对所述观测数据进行去混响处理,得到直达声和早期反射声的估计值;基于所述直达声和早期反射声的估计值,对所述多声源音频信号进行盲源分离处理,得到各声源的时域声源信号;所述基于所述直达声和早期反射声的估计值,对所述多声源音频信号进行盲源分离处理,包括:根据第一分离矩阵,对所述直达声和早期反射声的估计值进行盲源分离,得到所述至少两个声源中每个声源对应声源信号的先验频域估计;根据所述先验频域估计,得到加权系数以及对比函数,并基于所述加权系数和所述对比函数,对第一加权协方差矩阵进行更新,得到第二加权协方差矩阵;基于所述第二加权协方差矩阵,对所述第一分离矩阵进行更新,得到第二分离矩阵;基于所述第二分离矩阵,对所述直达声和早期反射声的估计值进行盲源分离,得到所述至少两个声源中每个声源对应声源信号的后验频域估计;根据所述后验频域估计,得到直达声和早期反射声的协方差矩阵估计更新值,更新直达声和早期声的协方差矩阵估计,并根据所述后验频域估计,得到各声源的时域声源信号;所述根据所述后验频域估计,得到直达声和早期反射声的协方差矩阵估计更新值,包括:根据所述后验频域估计和马尔可夫决策MDP算法,得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值;根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值,得到直达声和早期反射声的协方差矩阵估计更新值。

全文数据:

权利要求:

百度查询: 北京小米移动软件有限公司;北京小米松果电子有限公司 音频信号处理方法、音频信号处理装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术