Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜清华大学苏州汽车研究院(相城)姜彦吉获国家专利权

恭喜清华大学苏州汽车研究院(相城)姜彦吉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜清华大学苏州汽车研究院(相城)申请的专利一种采用麦克风阵列拾音的多通道语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114339539B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111411208.9,技术领域涉及:H04R1/40;该发明授权一种采用麦克风阵列拾音的多通道语音增强方法是由姜彦吉;梁振兴;刘海涛;彭博;郑四发设计研发完成,并于2021-11-25向国家知识产权局提交的专利申请。

一种采用麦克风阵列拾音的多通道语音增强方法在说明书摘要公布了:本发明公开了一种采用麦克风阵列拾音的多通道语音增强方法,该方法包括利用多个单通道麦克风对语音进行多通道拾音并进行预处理;基于参考麦克风的选择,采用NCC和MCS两种特征提取并联合平均的方式降低通道间的信号差异,设计出与参考麦克风对应的滤波器;对其它单通道麦克风进行NCC和MCS两种特征提取,并设计出与其它单通道参考麦克风一一对应的滤波器;将所有的单通道麦克风的增强语音信号进行联合并将进行均值处理,以获得最终的增强语音信号。本发明提供的多通道语音增强方法采用NCC和MCS两种特征提取并联合平均的方式降低通道间的信号差异,对室内空间中远近场带噪语音起到很好的降噪效果。

本发明授权一种采用麦克风阵列拾音的多通道语音增强方法在权利要求书中公布了:1.一种采用麦克风阵列拾音的多通道语音增强方法,其特征在于,包括以下步骤:S1、利用多个单通道麦克风对语音进行多通道拾音并进行预处理;S2、选择其中一个单通道麦克风作为参考麦克风,基于所述参考麦克风的选择,进行归一化处理多通道拾音信号,采用NCC和MCS两种特征提取并联合平均的方式降低通道间的信号差异,再通过多头注意力网络设计出与所述参考麦克风对应的滤波器,使用该滤波器对所述参考麦克风的拾音信号进行卷积操作,以获得所述参考麦克风滤波后的增强语音信号;S3、结合所述参考麦克风滤波后的增强语音信号,对其它单通道麦克风进行NCC和MCS两种特征提取,并通过多头注意力网络设计出与其它单通道参考麦克风一一对应的滤波器,其它单通道麦克风通过对应的滤波器对各自的拾音信号进行卷积操作,以分别获得其它单通道麦克风滤波后的增强语音信号;S4、将所有的单通道麦克风的增强语音信号进行联合并将进行均值处理,以获得最终的增强语音信号;在步骤S1中,预处理包括以下步骤:S101、对语音数据前后进行补零;S102、对补零后的语音数据进行分帧处理, 其中,M为帧长,K为帧移,Z为帧数,t是帧索引值,i是麦克风的索引,表示单通道麦克风i在帧t处的语音向量,xi表示第i个单通道麦克风对应的分帧语音数据;S103、对分帧后的语音数据添加上下文语音窗口, 其中,W为上下文窗口大小,是麦克风i在帧t处包含上下文的语音向量;S104、将所有通道的分帧语音数据x添加到数组中,形状为[N,M,Z],将所有通道的添加上下文窗口的语音数据添加到另一个数组中,形状为[N,2W+M,Z],其中N为通道数量;与所述参考麦克风对应的滤波器的设计包括以下步骤:S201、输入数据输入所述多头注意力网络输出,使用跳跃连接将输出的结果与所述输入数据相加,并进行LayerNorm正则化操作;S202、将步骤S201的结果经过带有Prelu激活函数的一维卷积处理;S203、将步骤S202的结果先进行形状变换,再经过BiLSTM和Prelu激活函数处理;S204、将步骤S203的结果输入到Linear线性层,并进行形状变换;S205、使用跳跃连接将步骤S201的结果与步骤S204的结果进行相加,并进行LayerNorm正则化操作;S206、对步骤S205的结果进行形状变换,然后对变换后的结果和步骤S201中的输入数据使用跳跃连接后,进行一维卷积操作,并使用Prelu激活函数处理;S207、将步骤S206的结果分别输入到带有sigmoid和Tanh激活函数的一维卷积中,并将其进行相乘后进行变换形状,以生成所述参考麦克风对应的滤波器;在步骤S3中,对添加上下文窗口的语音数据结合所述参考麦克风滤波后的增强语音信号进行NCC特征提取,对其它单通道麦克风对应的分帧语音数据进行MCS特征提取并进行平均池化操作,以作为所述多头注意力网络中的一部分输入数据;将其它单通道麦克风对应的添加上下文窗口的语音数据进行一维卷积以及GroupNorm操作,以得到所述多头注意力网络中的另一部分输入数据。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学苏州汽车研究院(相城),其通讯地址为:215134 江苏省苏州市相城区渭塘镇爱格豪路19号中汽零大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。