基于无监督的语音转换方法、装置、设备及介质

导航：龙图腾网> 最新专利技术> 基于无监督的语音转换方法、装置、设备及介质

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-04-30

公开（公告）日：2024-06-28

公开（公告）号：CN113178201B

主分类号：G10L21/007

分类号：G10L21/007;G10L25/30

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2021.11.19#实质审查的生效;2021.07.27#公开

摘要：本发明实施例公开了一种基于无监督的语音转换方法、装置、设备及介质，该方法通过获取第一说话人的第一语音的梅尔谱；根据样本分类网络从第二说话人的第二语音中获取第二说话人的风格特征并将第一说话人的第一语音的梅尔谱输入至内容编码器中，得到音素特征；基于第一说话人的第一语音的梅尔谱的长度，在解码器中将第二说话人的风格特征进行扩展并将扩展后的风格特征与音素特征进行拼接，通过解码器对拼接后的特征进行解码并采用声码器生成第二说话人的第一语音。本发明基于语音转换技术，通过无监督学习进行语音转换，不仅极大的减少了语音转换步骤，而且提高了转换后的语音的质量。

主权项：1.一种基于无监督的语音转换方法，其特征在于，包括以下步骤：获取多个样本语音，并依次对所述样本语音的语音信号进行预加重、分帧处理、加窗处理与快速傅里叶变换，以及将快速傅里叶变换后的语音信号输入至梅尔滤波器中，得到每个样本语音的梅尔谱；将所述样本语音的梅尔谱输入至样本分类网络中并根据生成的风格特征调用预置的交叉熵损失函数生成所述样本分类网络的交叉熵损失；将所述样本语音的梅尔谱输入至内容编码器中并根据生成的音素特征调用预置的互信息误差函数生成所述内容编码器的互信息误差；将所述样本语音的风格特征、音素特征拼接后输入至解码器中并根据生成的预测梅尔谱调用预置的重构误差函数、预置的说话人一致误差函数生成所述解码器的重构误差、说话人一致误差；根据所述交叉熵损失、所述互信息误差、所述重构误差以及所述说话人一致误差优化语音转换模型的参数，直至所述语音转换模型收敛；接收第一说话人的第一语音并对所述第一语音进行预处理，得到所述第一说话人的第一语音的梅尔谱；根据预置的所述语音转换模型的样本分类网络从第二说话人的第二语音中获取所述第二说话人的风格特征；将所述第一说话人的第一语音的梅尔谱输入至所述语音转换模型的内容编码器中，得到所述第一语音的音素特征；基于所述第一说话人的第一语音的梅尔谱的长度，在所述语音转换模型的解码器中将所述第二说话人的风格特征进行扩展并将扩展后的风格特征与所述第一语音的音素特征进行拼接，得到拼接后的特征；根据所述解码器对所述拼接后的特征进行解码，得到所述第二说话人的第一语音的梅尔谱；将所述第二说话人的第一语音的梅尔谱输入至预置的声码器中，得到所述第二说话人的第一语音。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司基于无监督的语音转换方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动开盖的压力烹饪器具

下一篇：一种砻谷机风选取粮器

相关技术

一种自动开盖的压力烹饪器具

一种砻谷机风选取粮器

一种用于3C零件组装的点胶设备

一种地铁车辆车钩检修用辅助工具

一种水利施工用混凝土搅拌装置

一种叠加机

一种酶转化罐内部恒温搅拌机构

一种数控机床主轴箱冷却装置

一种纸面石膏板加工用除尘装置

一种巡检方便的电容补偿柜

电池的装配结构、圆柱电池、电池模组和电池包

一种管道开槽定位工装

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

片间通信方法_中科寒武纪科技股份有限公司_202211681198.5

装置相关技术

发光装置和开关装置_法雷奥日本株式会社_202311810509.8

检漏装置及电源装置_华霆(合肥)动力技术有限公司_201810609560.5

振动装置和包括该振动装置的电子装置_乐金显示有限公司_202310325948.3

发送装置、接收装置以及基站_三菱电机株式会社_202080103380.5

分散装置以及堆积装置_精工爱普生株式会社_202311810325.1

手柄、输送装置及消融装置_深圳市先健呼吸科技有限公司_202211685727.9

节流装置和冷藏冷冻装置_青岛海尔电冰箱有限公司_202211677886.4

上下料装置和运输装置_拉普拉斯新能源科技股份有限公司_202410248213.X

SCR脱硝装置的导流装置_哈尔滨锅炉厂有限责任公司_201811073270.X

经由胆道进入装置的装置输送_波士顿科学国际有限公司_202280072490.9

转换相关技术

高压转换电路及高压转换器_融硅思创(北京)科技有限公司_202322844284.X

电力转换装置_株式会社东芝_202311767960.6

升压转换器_罗姆股份有限公司_202380014533.2

电平转换器_上海韦尔半导体股份有限公司_201910498560.7

节能环保热能转换炉_田化勇_201810737900.2

电平转换器和包括电平转换器的显示装置_乐金显示有限公司_202311810015.X

中压电源转换系统与分散式中压电源转换系统_台达电子工业股份有限公司_202310985323.X

逐次逼近模数转换器_瑞典爱立信有限公司_202410474273.3

吸塑盘工位转换装置_苏州司达夫超声科技有限公司_202323269139.X

信号转换装置及系统_深圳市嘉昱机电有限公司_201911256830.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于无监督的语音转换方法、装置、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务