语音分离模型的训练方法和装置、语音分离方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：安徽大学

摘要：本申请涉及一种语音分离模型的训练方法和装置、语音分离方法，语音分离模型包括教师模型和学生模型。其中，该语音分离模型的训练方法包括：获取相对应的样本音频数据和样本视频数据；通过样本音频数据和样本视频数据对教师模型进行监督训练；通过样本音频数据对学生模型进行监督训练，并在训练过程中通过训练后的教师模型对学生模型进行训练指导。通过上述语音分离模型的训练方法，最终得到高性能的学生模型。训练后的学生模型应用在实际语音分离场景中，可以准确地对单独的音频数据进行分离，而不需要相对应的视频数据进行辅助。因此，解决了现有的语音分离技术难以准确地对无同步视频数据的音频数据进行语音分离的问题。

主权项：1.一种语音分离模型的训练方法，其特征在于，所述语音分离模型包括教师模型和学生模型，所述训练方法包括：获取相对应的样本音频数据和样本视频数据；通过所述样本音频数据和所述样本视频数据对所述教师模型进行监督训练；通过所述样本音频数据对所述学生模型进行监督训练，并在训练过程中通过训练后的所述教师模型对所述学生模型进行训练指导；其中，所述教师模型包括第一音频编码器、唇读提取器、视频编码器、深度注意力融合模块、第一分离器和第一音频解码器；通过所述样本音频数据和所述样本视频数据对所述教师模型进行监督训练，包括：通过所述第一音频编码器对所述样本音频数据进行编码得到第一音频特征；通过所述唇读提取器对所述样本视频数据进行特征提取得到唇部特征，通过所述视频编码器对所述唇部特征进行编码得到视觉特征；通过所述深度注意力融合模块对所述第一音频特征和所述视觉特征进行融合得到多模态特征；通过所述第一分离器对所述多模态特征进行分离预测得到第一预测结果；通过所述第一音频解码器对所述第一预测结果和所述样本音频数据进行解码得到第一音频分离结果；以最小化所述第一音频分离结果与音频分离标签之间的损失为目标，迭代训练所述教师模型；所述学生模型包括第二音频编码器、第二分离器和第二音频解码器；通过所述样本音频数据对所述学生模型进行监督训练，并在训练过程中通过训练后的所述教师模型对所述学生模型进行训练指导，包括：通过所述第二音频编码器对所述样本音频数据进行编码得到第二音频数据；通过所述第二分离器对所述第二音频数据进行分离预测得到第二预测结果；通过所述第二音频解码器对所述第二预测结果和所述样本音频数据进行解码得到第二音频分离结果；以最小化所述第二音频分离结果的损失为目标，迭代训练所述学生模型；其中，所述第二音频分离结果的损失包括所述第二音频分离结果与音频分离标签之间的损失以及所述第二音频分离结果与所述第一音频分离结果之间的损失。

全文数据：

权利要求：

百度查询：安徽大学语音分离模型的训练方法和装置、语音分离方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种蒸镀装置

下一篇：一种车辆安全检测的方法

相关技术

一种蒸镀装置

一种车辆安全检测的方法

一种饲料包装机

一种杂食性家蚕的分子育种方法及应用方法

威灵仙生物碱类化合物及其用途

一种遥控双稳坦克模型

一种病理组织切片染色设备

一种矿渣智能运输控制系统及方法

一种机理与数据双向融合驱动的电力通信光缆数字孪生建模方法

用于中空吹塑的树脂组合物及其制备方法和应用

一种干湿法结合的高塔尾气净化装置及净化过程

衣物的香薰方法、装置、设备及介质

模型相关技术

模型训练方法和基于模型的场景流估计方法_天津港(集团)有限公司_202411061324.6

推荐模型更新方法、推荐模型训练方法及计算设备_阿里巴巴(中国)有限公司_202210648557.0

复杂构造的地层层速度模型建立方法及地层层速度模型_中国石油大学(华东)_202310255427.5

高精度SiC MOSFET双脉冲仿真模型及模型构建方法_上海机电工程研究所_202410916585.5

基于骨架模型的机床几何模型还原方法、系统及存储介质_武汉重型机床集团有限公司_202410757062.0

基于紫东太初大模型的焊缝识别、训练方法、模型及系统_华工科技产业股份有限公司_202410988844.5

一种返修巷道模型试验衬砌模型预制装置及方法_中国地质科学院地质力学研究所_202411088973.5

一种泪道模型教具_武汉爱尔眼科医院有限公司_202420432991.X

一种油茶制作模型机_广西师范大学_202420394410.8

几何模型导航方法及计算设备_华为技术有限公司_202310475184.6

训练相关技术

智力训练设备_广拥之(南京)科技有限公司_202411273641.4

步态训练装置_睿德辅具股份有限公司_202410480175.0

舌象教学训练装置_北京博哥科技合伙企业(有限合伙)_202110629791.4

一种慢阻肺腹式呼吸训练用膈肌训练设备_广州医科大学附属第一医院(广州呼吸中心)_202410826400.1

一种脊柱矢状位活动训练装置及训练方法_香港大学深圳医院_202410879972.6

一种康复训练系统_广州一康医疗设备实业有限公司_202411130463.X

一种舌肌训练装置_武汉市中心医院_202323319022.8

一种骨伤恢复训练装置_射洪市妇幼保健院(射洪市妇幼保健卫生服务中心)_202323324584.1

一种阅读能力训练装置_德吉卓玛_202323523142.X

模型训练方法及装置_阳光保险集团股份有限公司_202010639435.6

方法相关技术

刻蚀方法_上海华力集成电路制造有限公司_202111238596.5

硅片的碱抛光方法、PERC电池及其制备方法_通威太阳能(安徽)有限公司_202210231922.8

资源处理方法及装置、支付处理方法及装置_支付宝(杭州)信息技术有限公司_202011488565.0

目标抓拍方法、目标质量评价方法以及相关设备_华为技术有限公司_202310470331.0

图像解码方法、编码方法及装置_杭州海康威视数字技术股份有限公司_202111335613.7

车辆路径规划方法、决策方法、驾驶方法、装置、车辆、介质及设备_深蓝汽车科技有限公司_202410839835.X

除铊药剂及其制备方法和使用方法_宝武水务科技有限公司_202410943199.5

多孔材料及其应用、制备方法和检测方法_宁波大学_202410853593.X

曝光装置、曝光方法和物品制造方法_佳能株式会社_202410498719.6

显示驱动电路、方法、显示面板及其制备方法、装置_合肥京东方卓印科技有限公司_202210596913.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

语音分离模型的训练方法和装置、语音分离方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务