一种低样本多语种的合成语音克隆方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：爱汇葆力(广州)数据科技有限公司

摘要：本发明属于语音合成技术领域，尤其涉及一种低样本多语种的合成语音克隆方法及系统，语音采集器：整个语音克隆合成系统的前端部分，负责从用户那里实时地收集语音样本；该设备能够捕捉用户的语音信号，包括语调和发音特征，并将这些信号转换成数字格式，以便于后续的处理和分析，通过对音色提取、音色转换、音色嵌入和音色合成等步骤进行重新调整和改进，提供一个低样本、多语种的语音克隆合成系统。该系统能够利用少量语音样本实现高质量的语音合成，同时具备良好的实时性和广泛的语种适应性，克服了现有技术的局限性，满足了实时应用场景的需求，并拓宽了语音合成技术的应用范围。

主权项：1.一种低样本多语种的合成语音克隆方法及系统，其特征在于，包括：语音采集器：整个语音克隆合成系统的前端部分，负责从用户那里实时地收集语音样本；该设备能够捕捉用户的语音信号，包括语调和发音特征，并将这些信号转换成数字格式，以便于后续的处理和分析，高质量的语音采集对于确保合成语音的自然度和准确性至关重要；音色提取器：从采集到的语音样本中分析和提取关键的音色特征；这些特征包括音高、音色、强度等，它们共同决定了一个人语音的独特性，音色提取器利用先进的语音分析技术，如傅里叶变换或深度学习算法，来识别和提取这些特征，为音色的转换和嵌入打下基础；音色转化器：音色转化器负责将提取的音色特征转换为标准化特征向量，这一转换过程是音色嵌入前的关键步骤，通过采用信号处理技术和机器学习算法，音色转化器确保了音色特征的准确性和可用性，为生成具有个性化音色特征的语音提供了基础；音色嵌入器：音色嵌入器将转换后的音色特征应用到基础语音模型中，以生成具有目标音色特征的语音输出，该服务通过深度学习技术，将音色特征嵌入到语音合成模型的参数中，从而生成与目标音色相匹配的语音信号；基础语音模型：基础语音模型是语音合成系统的核心组件，主要负责将文本转换为语音；该模型利用生成对抗网络GANs在大量语音数据上进行训练，以生成高质量的语音输出，它不仅能够处理多种语言和方言，还适应于不同的语调和情感表达，从而提供灵活且自然的语音合成能力；文本采集器：文本采集器作为语音合成系统的输入模块，负责接收并处理用户的文本数据；它提供一个用户友好的界面，允许用户输入或上传希望转换成语音的文本内容；此外，文本采集器还可以集成自然语言处理NLP技术，以优化文本的理解和预处理，确保语音合成的准确性和流畅性；音色合成器：音色合成器是语音合成过程的最终阶段，它将嵌入了音色特征的语音模型输出转换为最终的语音信号，该服务结合了音色嵌入器的输出和基础语音模型的文本到语音转换能力，生成最终的合成语音，音色合成器还需要确保合成语音的流畅性和自然度，以提供高质量的语音输出。

全文数据：

权利要求：

百度查询：爱汇葆力(广州)数据科技有限公司一种低样本多语种的合成语音克隆方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种中医针灸辅助装置

下一篇：一种应用于硅碳复合材料的反应装置

相关技术

一种中医针灸辅助装置

一种应用于硅碳复合材料的反应装置

一种智能型多功能机械伤害体验装置

一种刹车盘保护盖

一种电炉铁液随流孕育装置

一种带有扭簧结构的碳带回收轴

一种外卖无接触配送方法、装置、设备及存储介质

一种硅胶产品检测及分选装置

回环检测方法、装置、电子设备和存储介质

一种高矫顽力的R-T-B永磁体及其制备方法和应用

一种拉杆切割打孔集成设备及加工工艺

一种浅层地下水污染用治理装置

语音相关技术

语音识别方法、装置、语音交互设备及存储介质_思必驰科技股份有限公司_202210420727.X

用于语音合成的语音数据扩增方法及系统_思必驰科技股份有限公司_202210369510.0

语音合成方法、语音合成装置、电子设备及存储介质_平安科技(深圳)有限公司_202410841463.4

一种语音控制传感装置_辽宁亿联精工科技有限公司_202323082461.1

用于文字转语音装置的底座_东莞明信电子有限公司_202323225867.0

智能语音机器人系统_青岛海尔乐信云科技有限公司_202410887989.6

一种多功能语音翻译设备_常熟它思清源科技有限公司_202323494170.3

语音增强方法、装置、电子设备及介质_北京大学_202410570722.4

一种显示设备及语音唤醒方法_海信视像科技股份有限公司_202410658728.7

语音处理方法、电子设备和存储介质_思必驰科技股份有限公司_202210475913.3

合成相关技术

功率合成器及功率合成器组件_清华大学_202410718308.3

语音合成方法、语音合成装置、电子设备及存储介质_平安科技(深圳)有限公司_202410841463.4

土工合成材料试验夹具_仪征易力土工合成材料有限公司_202323227623.6

制备合成气的方法、合成气制备装置及利用该合成气制备液态烃的方法_SK新技术株式会社_202311799905.5

合成氨装置用合成气压缩机系统和喘振控制方法_沈阳透平机械股份有限公司_202410838311.9

一种用于金刚石的合成压机_河南恒达超硬材料有限公司_202310925761.7

一种叔丁醇钾合成装置_汶上高兴新材料有限公司_202420183472.4

一种刚性润滑聚氨酯的合成方法_浙江艾领创矿业科技有限公司_202410596191.6

可快速降温的合成革及其制备方法_世联汽车内饰(苏州)有限公司_202411063720.2

一种用于有机合成的反应釜_四川同晟生物医药有限公司_202420126572.3

克隆相关技术

一株具有中和活性的猪δ冠状病毒单克隆抗体_华中农业大学_202410475013.8

一种行为克隆强化学习的零碳园区调度方法及系统_国网江西省电力有限公司电力科学研究院_202410402010.1

特异性结合CCSP-2的单克隆抗体及其用途_财团法人峨山社会福祉财团_202080011664.1

一种乙肝病毒表面抗原的单克隆抗体及其应用_复旦大学附属中山医院_202211063471.8

一种抗PMS2重组兔单克隆抗体及其应用_苏州百道医疗科技有限公司_202411106772.3

一种抗黄曲霉毒素B1单克隆抗体及其应用_北京纳百生物科技有限公司_202211115364.5

一种抗P40重组兔单克隆抗体及其应用_苏州百道医疗科技有限公司_202411106849.7

一种肺炎克雷伯菌多糖单克隆抗体、其杂交瘤细胞株及其应用_上海博钒生物科技有限公司_202311815637.1

一种检测试纸用的独立质控系统、杂交瘤细胞株、质控线用包被单克隆抗体及其应用_青岛硕景生物科技有限公司_202210778156.7

一种用于检测单克隆抗体及其类似物糖化水平的硼酸亲和色谱法_联邦生物科技(珠海横琴)有限公司_202310234660.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种低样本多语种的合成语音克隆方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务