买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉大学
摘要:目前的语音合成技术通常只针对常用语音,如汉语、英语等。小语种的语音合成技术却少有人涉足,主要原因为小语种使用人数较少、语料搜集困难等。针对现有小语种语音合成的不足和难点,本发明提供了一种基于隐式音素转换的小语种迁移学习语音合成方法,主要利用迁移学习将主流语种中学到的知识应用到小语种合成中,并且提出音素转换网络解决了不同语种中输入特征不匹配的问题。该方法所需小语种预料数量低,训练速度快,能有效实现小语种的语音合成。
主权项:1.一种基于隐式音素转换的小语种迁移学习语音合成方法,其特征在于,包括:S1:收集大量主流语种语料与少量小语种语料;S2:获得预训练的语音生成模型;S3:利用收集的大量主流语种语料与少量小语种语料训练音素转换模型,得到训练好的音素转换模型,其中,音素转换模型包括一个编码器和两个解码器,编码器用以将词嵌入向量编码成隐向量且不区分语种,不同的语种具有不同的解码器,解码器用于从隐向量中解码出对应的语种音素;S4:利用步骤S3训练好的音素转换模型对小语种数据进行音素转换,并利用因素转换得到的小语种音素数据重新对步骤S2中预训练的语音生成模型进行训练;S5:利用步骤S4中训练好的语音合成模型,进行小语种语音合成。
全文数据:
权利要求:
百度查询: 武汉大学 一种基于隐式音素转换的小语种迁移学习语音合成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。