歌声合成方法、装置、计算机设备及存储介质

导航：龙图腾网> 最新专利技术> 歌声合成方法、装置、计算机设备及存储介质

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-06-30

公开（公告）日：2024-05-10

公开（公告）号：CN113421544B

主分类号：G10L13/02

分类号：G10L13/02;G10L25/30;G10L25/03;G10L25/48

优先权：

专利状态码：有效-授权

法律状态：2024.05.10#授权;2021.11.12#实质审查的生效;2021.09.21#公开

摘要：本发明公开了一种歌声合成方法、装置、计算机设备及存储介质，其中方法包括：从待转换为歌声音频的MIDI文件中提取歌曲特征并输入至预先训练好的声学模型，得到梅尔频谱；利用预先训练好的图像优化模型对梅尔频谱进行优化，图像优化模型根据声学模型输出的梅尔频谱样本和预先准备好的高采样率梅尔频谱样本训练得到；将优化后的梅尔频谱输入至预先训练好的声码器中进行转化，得到歌声音频文件。通过上述方式，本发明能够使用图像优化模型对声学模型生成的梅尔频谱进行细节上的优化，然后再由声码器根据该优化后的梅尔频谱进行歌声合成，使得合成的歌声效果更好。

主权项：1.一种歌声合成方法，其特征在于，包括：从待转换为歌声音频的MIDI文件中提取歌曲特征并输入至预先训练好的声学模型，得到梅尔频谱；分析所述梅尔频谱以得到每一帧梅尔频谱对应的基本频率和发声特征；利用预先训练好的图像优化模型对所述梅尔频谱进行优化，所述图像优化模型根据所述声学模型输出的梅尔频谱样本和预先准备好的高采样率梅尔频谱样本训练得到；将优化后的所述梅尔频谱输入至预先训练好的声码器中进行转化，得到歌声音频文件；所述将优化后的所述梅尔频谱输入至预先训练好的声码器中进行转化，得到歌声音频文件的操作包括，将所述优化后的梅尔频谱与优化前的所述梅尔频谱逐帧对应，以获知每帧所述优化后的梅尔频谱对应的基本频率和发声特征；将所述优化后的梅尔频谱输入至所述声码器，当所述声码器将当前帧的梅尔频谱转换为音频后，将所述当前帧对应的所述基本频率添加至所述音频中；判断所述音频的当前发声特征与所述当前帧对应的所述发声特征是否一致；若是，则保存所述音频；若否，则根据所述发声特征调整所述音频的当前发声特征再保存；根据所有保存的音频组合成所述歌声音频文件。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司歌声合成方法、装置、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于防潮功能的变频器控制箱

下一篇：一种稳固性良好的电动自行车

相关技术

一种基于防潮功能的变频器控制箱

一种稳固性良好的电动自行车

一种用于储水桶的多重密封结构

一种船舶舷外机通风型保护罩

一种中空建筑模板送料调节装置

一种移动式自填充胶枪

一种刀片可调节的修边机

一种厌氧罐进水分布机构

一种电表排母接口测量装置

一种装配式铝方通转角拼接结构

一种可快速拼接的安装架

一种用于治疗小儿肌性斜颈的固定器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

歌声合成方法、装置、计算机设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务