首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种对声调建模的声音转换方法及系统、计算机设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京跳悦智能科技有限公司

摘要:本发明涉及一种对声调建模的声音转换方法,以AM模型和vocoder模型为基础,结合端到端的联合训练方式,构建并获得声音转换模型,应用声音波形、以及声音波形所对应的频谱能量Energy、基频F0、捕获扬声器id作为输入,通过对声调特征进行建模,获得与之对应的目标声音的转换,保留目标对象情感的同时,增加了变声之后的情感丰富度,有效提高了转换后声音的真实性与音质。

主权项:1.一种对声调建模的声音转换方法,其特征在于,按如下步骤A至步骤D,获得第一目标对象与第二目标对象之间关于声音转换的声音转换模型;并基于声音转换模型,执行步骤i至步骤ii,实现将第一目标对象的声音转换为第二目标对象的声音;步骤A.基于AM模型结构,构建以声音波形、关于声音波形所对应频谱能量Energy的嵌入特征、关于声音波形所对应基频F0的嵌入特征、关于声音波形所对应捕获扬声器id的嵌入特征为输入,声音波形所对应混合声学特征为输出的声学特征提取模型,然后进入步骤B;步骤B.基于卷积神经网络,构建以声音波形所对应混合声学特征为输入,该混合声学特征所对应转换后声音波形为输出的语音编码器模型,并以声学特征提取模型输出端对接语音编码器模型输入端的方式,构建声音转换模型,然后进入步骤C;步骤C.基于预设来自第一目标对象的各个第一声音样本波形、以及来自第二目标对象分别与各第一声音样本波形一一对应的第二声音样本波形,获得各个第一声音样本波形分别所对应的频谱能量Energy、基频F0,然后进入步骤D;步骤D.基于各个第一声音样本波形、以及分别与各第一声音样本波形一一对应的第二声音样本波形,以第一声音样本波形、第一声音样本波形所对应的频谱能量Energy、基频F0、捕获扬声器id为输入,第一声音样本波形所对应第二声音样本波形为输出,结合第一声音样本波形与所输出第二声音样本波形之间的鉴别损失、频谱损失,针对声音转换模型进行训练,获得训练后的声音转换模型;步骤i.捕获来自第一目标对象的目标声音波形,并应用步骤C中针对第一声音样本波形的方法,获得目标声音波形所对应的频谱能量Energy、基频F0,然后进入步骤ii;步骤ii.基于目标声音波形、目标声音波形所对应的频谱能量Energy、基频F0、捕获扬声器id,应用声音转换模型,获得目标声音波形所对应转换后声音波形,即实现将第一目标对象的声音转换为第二目标对象的声音。

全文数据:

权利要求:

百度查询: 北京跳悦智能科技有限公司 一种对声调建模的声音转换方法及系统、计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。