首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于跨层相似性知识蒸馏的语音增强方法_南京工程学院_202111385676.3 

申请/专利权人:南京工程学院

申请日:2021-11-22

公开(公告)日:2024-06-21

公开(公告)号:CN114067819B

主分类号:G10L21/02

分类号:G10L21/02;G06N3/0464;G06F18/214;G06F18/22;G06N3/0442;G06F18/25;G06N3/096

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2022.03.08#实质审查的生效;2022.02.18#公开

摘要:本发明公开了基于跨层相似性知识蒸馏的语音增强方法,包括提取深度神经网络的输入特征,再构建基于深度复卷积循环语音增强网络结构的蒸馏基础模型,接着根据蒸馏基础模型构建基于跨层相似性蒸馏的师生学习框架,并预训练大规模参数的蒸馏基础模型作为教师模型,再利用预训练好的教师模型对学生模型进行蒸馏;本发明提出了跨级路径连接的策略,并融合了多层教师模型的有效信息来引导单层学生网络,且为了更好地适应语音增强任务,引入了帧级相似性蒸馏损失,并在教师和学生的表示空间中保留成对相似性以最终实现知识转移,还用大规模的教师模型引导轻量的学生模型,能够有效的提升低复杂度语音增强模型的效果,具有良好的应用前景。

主权项:1.基于跨层相似性知识蒸馏的语音增强方法,其特征在于:包括以下步骤,步骤A,提取深度神经网络的输入特征;步骤B,构建基于深度复卷积循环语音增强网络结构的蒸馏基础模型;步骤C,根据蒸馏基础模型构建基于跨层相似性蒸馏的师生学习框架,并预训练大规模参数的蒸馏基础模型作为教师模型,其中师生学习框架包括教师模型和学生模型,教师模型和学生模型使用相同的蒸馏基础模型架构,但教师模型的每个对应层通道数为学生模型的四倍;多层教师模型和学生模型之间的有效信息采用特征融合变换层进行传递,其中特征融合变换层包括两层正向卷积层和一层卷积层,且特征融合的成对相似度能作为蒸馏损失;步骤D,利用预训练好的教师模型对学生模型进行蒸馏,并产生蒸馏输出结果;步骤E,基于蒸馏的输出结果,利用成对相似度矩阵计算特征距离;步骤F,将输入特征中的带噪语音复频谱谱特征输入到蒸馏后的学生模型并重建增强语音波形。

全文数据:

权利要求:

百度查询: 南京工程学院 基于跨层相似性知识蒸馏的语音增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。