首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

语音风格迁移方法、装置、设备及存储介质 

申请/专利权人:平安科技(深圳)有限公司

申请日:2024-04-19

公开(公告)日:2024-06-28

公开(公告)号:CN118262740A

主分类号:G10L25/24

分类号:G10L25/24;G10L25/63;G10L13/08;G10L19/00

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明涉及人工智能领域及金融科技领域,公开了语音风格迁移方法、装置、设备及存储介质,该方法包括:获取待合成文本的语音风格和样本音频数据的各个细粒度特征;对细粒度特征进行打分,得到各个细粒度特征的分值;对各个细粒度特征的分值进行归一化处理,确定各个细粒度特征的归一化权重值;基于风格迁移强度,对各个细粒度特征的归一化权重值进行修正,得到修正后的各个细粒度特征;获取待合成文本的音素序列,将音素序列输入至编码器中,得到音素编码特征;将音素编码特征以及修正后的各个细粒度特征进行融合处理,确定融合特征;对融合特征进行语音合成处理,生成符合风格迁移强度的合成语音。本发明有利于提高风格迁移的效率。

主权项:1.一种语音风格迁移方法,其特征在于,包括:获取待合成文本的语音风格和样本音频数据的各个细粒度特征;采用预设的打分函数,对所述细粒度特征进行打分,得到各个所述细粒度特征的分值;对各个所述细粒度特征的分值进行归一化处理,确定各个所述细粒度特征的归一化权重值;基于预设的风格迁移强度,对各个所述细粒度特征的归一化权重值进行修正,得到修正后的各个所述细粒度特征,所述风格迁移强度用于指示各个所述细粒度特征从所述语音风格迁移到目标风格的迁移程度;获取所述待合成文本的音素序列,将所述音素序列输入至预设的语音合成模型的编码器中,得到所述编码器输出的所述待合成文本的音素编码特征;将所述音素编码特征以及修正后的各个所述细粒度特征进行融合处理,确定融合特征;基于所述语音合成模型对所述融合特征进行语音合成处理,生成符合所述风格迁移强度的合成语音。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 语音风格迁移方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。