Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 随锐科技集团股份有限公司何平获国家专利权

随锐科技集团股份有限公司何平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉随锐科技集团股份有限公司申请的专利一种基于谐波结构预测的语音增强后处理方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114360560B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210049231.6,技术领域涉及:G10L21/02;该发明授权一种基于谐波结构预测的语音增强后处理方法和装置是由何平;蒋升设计研发完成,并于2022-01-17向国家知识产权局提交的专利申请。

一种基于谐波结构预测的语音增强后处理方法和装置在说明书摘要公布了:本发明公开了一种基于谐波结构预测的语音增强后处理方法和装置,属于信息处理的领域,该方法包括以下步骤:S1:对麦克风的语音信号进行短时傅里叶变换得到时频域表达;S2:对时频域信号进行谐波损失估计和矫正,得到估计的功率谱密度;S3:根据功率谱密度估计时频掩蔽值;S4:根据估计的时频掩蔽值,获取目标语音的频域估计,进而得到目标语音时域估计。本发明能够一定程度上预测丢失的谐波结构,恢复的语音更符合近讲语音的特点,可懂度和语音感知质量更高。

本发明授权一种基于谐波结构预测的语音增强后处理方法和装置在权利要求书中公布了:1.一种基于谐波结构预测的语音增强后处理方法,其特征在于,包括以下步骤:S1:对麦克风的语音信号进行短时傅里叶变换得到时频域表达;S2:对时频域信号进行谐波损失估计和矫正,得到估计的功率谱密度;S3:根据功率谱密度估计时频掩蔽值;S4:根据估计的时频掩蔽值,获取目标语音的频域估计,进而得到目标语音时域估计;所述步骤S1之前还包括:获取麦克风的语音信号xn;所述步骤S1中对麦克风的语音信号xn进行短时傅里叶变换的过程如下: 其中,N为帧长,N=512;wn为长度512的汉明窗函数,n为时间标签;l为时间帧序号;k为频带序号;j代表虚数单位;Xl,k为第m个麦克风信号,在第l帧,第k个频带的频谱;所述步骤S2具体包括以下步骤:S201:采用深度学习估计的第一时频掩蔽值Ml,k,计算掩蔽后的时域信号其具体的计算过程如下: S202:对掩蔽后的时域信号进行半波整流之后,进行傅里叶变换,得到谐波损失的估计其具体的计算公式如下: 其中,sign代表半波整流运算;S203:对谐波损失的估计进行矫正,其矫正过程如下: S204:对每一个频带k,采用统一的平滑因子α,估计功率谱密度;其中,功率谱密度包括背景噪音的功率谱密度、时频掩蔽后语音的功率谱密度和谐波损失的功率谱密度;功率谱密度的估计过程如下:ρvk=αρvk+1-α1-Ml,k|Xl,k|2ρsk=αρsk+1-αMl,k|Xl,k|2 其中,ρvk、ρsk和ρhk分别为背景噪音、时频掩蔽后语音、谐波损失的功率谱密度;所述步骤S3中,对每一个频带k,估计第二时频掩蔽值Gl,k,其估计过程如下: 其中,max代表取二者中的大值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人随锐科技集团股份有限公司,其通讯地址为:100192 北京市海淀区宝盛南路1号奥北科技园19号楼北京随锐中心;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。