首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于韵律边界的语音合成方法及装置、介质、设备 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-09-27

公开(公告)日:2024-06-25

公开(公告)号:CN112151009B

主分类号:G10L13/10

分类号:G10L13/10;G10L13/027

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2021.11.09#实质审查的生效;2020.12.29#公开

摘要:本发明提供了一种基于韵律边界的语音合成方法及装置、介质、设备,该方法包括:获取待合成文本信息的韵律边界信息,基于韵律边界信息生成图嵌入信息;生成图嵌入信息的隐状态向量以及待合成文本信息的序列编码;基于隐状态向量和序列编码生成语音语谱;依据语音语谱合成待合成文本信息的语音信息。基于本发明提供的方法,可以从文本侧分析句子的语义和语法结构,将韵律边界通过图嵌入来表示,使得文本中的韵律信息能够充分的参与训练与推理,提升所合成语音信息的韵律感。本发明还涉及区块链技术,隐状态向量以及待合成文本信息的序列编码等数据存储于区块链中,从而提高数据存储的安全性。

主权项:1.一种基于韵律边界的语音合成方法,其特征在于,包括:获取待合成文本信息的韵律边界信息,基于所述韵律边界信息生成图嵌入信息;基于预设的神经网络模型生成所述图嵌入信息的隐状态向量和所述待合成文本信息的序列编码;基于所述隐状态向量和序列编码生成语音语谱;依据所述语音语谱合成所述待合成文本信息的语音信息;所述获取待合成文本信息的韵律边界信息,基于所述韵律边界信息生成图嵌入信息,包括:将所述待合成文本信息按照预设韵律边界结构划分为多个层级;其中,所述层级包括韵律词、韵律短语;获取所述待合成文本信息中对应各韵律词的第一向量;将属于同一韵律短语的多个所述第一向量进行两两组合,生成对应不同组合的第二向量;基于所述第一向量和所述第二向量组合形成图嵌入信息。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 一种基于韵律边界的语音合成方法及装置、介质、设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。