跨语言语音转换方法、装置、设备及介质

导航：龙图腾网> 最新专利技术> 跨语言语音转换方法、装置、设备及介质

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-05-31

公开（公告）日：2024-06-07

公开（公告）号：CN113345431B

主分类号：G10L15/16

分类号：G10L15/16;G10L15/06;G10L15/00;G10L13/027;G10L25/24

优先权：

专利状态码：有效-授权

法律状态：2024.06.07#授权;2021.11.19#实质审查的生效;2021.09.03#公开

摘要：本发明涉及人工智能领域，提供一种跨语言语音转换方法、装置、设备及介质，能够训练每个目标语言的ASR模型，及训练转换模型，当接收到待处理语音时，利用每个目标语言的ASR模型生成所述待处理语音的PPGs，进一步将所述待处理语音的PPGs输入至所述转换模型，并获取所述转换模型的输出作为所述待处理语音的声学语音参数，启动声码器根据所述待处理语音的声学语音参数合成语音，进而实现跨语言语音转换，并解决使用单个用户录制多语言语料库所带来的困难。此外，本发明还涉及区块链技术，训练得到的模型可存储于区块链节点中。

主权项：1.一种跨语言语音转换方法，其特征在于，所述跨语言语音转换方法包括：获取预先配置的多个目标语言，并调用与所述多个目标语言相对应的多个通用语料库；提取每个通用语料库中语料的梅尔频率倒谱系数MFCC作为训练数据，并分别训练对应于每个目标语言的自动语音识别ASR模型；调用文本转换TTS语料库，并从所述TTS语料库中获取所述TTS语料库所存储的每个语料的声学语音参数；提取每个语料的MFCC，将每个语料的MFCC分别输入至每个目标语言的ASR模型，并获取每个目标语言的ASR模型的输出作为每个语料对应于每个目标语言的语音后验概率PPG；对每个语料对应于每个目标语言的PPG进行融合处理，得到每个语料的目标语音后验概率PPGs；将每个语料的PPGs确定为输入，将每个语料的声学语音参数确定为输出，并训练指定神经网络模型，得到转换模型；当接收到待处理语音时，利用每个目标语言的ASR模型生成所述待处理语音的PPGs；将所述待处理语音的PPGs输入至所述转换模型，并获取所述转换模型的输出作为所述待处理语音的声学语音参数；启动声码器根据所述待处理语音的声学语音参数合成语音；其中，所述分别训练对应于每个目标语言的自动语音识别ASR模型包括：语料划分：将每个目标语言对应的通用语料库中的语料按照预设比例随机划分为第一语料集和第二语料集；模型训练：将所述第一语料集确定为训练集训练模型，并将所述第二语料集确定为验证集验证训练得到的模型；重复执行所述语料划分及所述模型训练，直至每个目标语言对应的通用语料库中的语料都作为所述训练集中的数据训练过模型，且每个目标语言对应的通用语料库中的语料都作为所述验证集中的数据验证过训练得到的模型，停止训练，得到所述对应于每个目标语言的ASR模型；所述TTS语料库所存储的每个语料的声学语音参数包括：梅尔倒谱系数MCEP、基频LF0及波段非周期性BAP；所述利用每个目标语言的ASR模型生成所述待处理语音的PPGs包括：提取所述待处理语音的MFCC；将所述待处理语音的MFCC分别输入每个目标语言的ASR模型；获取每个目标语言的ASR模型的输出作为所述待处理语音对应于每个目标语言的PPG；融合所述待处理语音对应于每个目标语言的PPG，得到所述待处理语音的PPGs。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司跨语言语音转换方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动开盖的压力烹饪器具

下一篇：一种仓库物资搬运装置

相关技术

一种自动开盖的压力烹饪器具

一种仓库物资搬运装置

混料搅拌装置

一种用于3C零件组装的点胶设备

一种配电网规划用的智慧配电网架

一种预应力钢绞线辅助穿束防缠绕工具

一种砂浆压实装置

一种NB模组驱动的摄像采集装置

一种叠加机

一种公共卫生用预防传染病喷雾装置

一种新型预制电力排管

一种螺旋输送装置

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

坏点检测模型训练方法、坏点检测方法以及坏点修复方法_京东方科技集团股份有限公司_202280003858.6

转换相关技术

高压转换电路及高压转换器_融硅思创(北京)科技有限公司_202322844284.X

电力转换装置_株式会社东芝_202311767960.6

升压转换器_罗姆股份有限公司_202380014533.2

电平转换器_上海韦尔半导体股份有限公司_201910498560.7

节能环保热能转换炉_田化勇_201810737900.2

电平转换器和包括电平转换器的显示装置_乐金显示有限公司_202311810015.X

中压电源转换系统与分散式中压电源转换系统_台达电子工业股份有限公司_202310985323.X

逐次逼近模数转换器_瑞典爱立信有限公司_202410474273.3

吸塑盘工位转换装置_苏州司达夫超声科技有限公司_202323269139.X

信号转换装置及系统_深圳市嘉昱机电有限公司_201911256830.X

语音相关技术

语音唤醒方法、语音交互方法及装置、可穿戴设备_北京蜂巢世纪科技有限公司_202410485157.1

智能语音控制方法及相关设备_沈阳创高天誉科技有限公司_202410677354.3

语音信号处理方法及装置_广州三星通信技术研究有限公司_202211687982.7

语音交互的方法和电子设备_华为终端有限公司_202211684847.7

基于意图识别的语音交互方法及系统_平安科技(深圳)有限公司_202110435594.9

语音播报电子烟灰缸及其控制系统_黄冈市卓源智能科技有限公司_202410424337.9

语音质检方法、装置、设备及存储介质_平安银行股份有限公司_202110572189.1

一种收款语音播报器电路_河南掌优电子科技有限公司_202323024680.4

语音识别方法和电子设备_荣耀终端有限公司_202310103614.1

远场语音唤醒方法、设备、介质和产品_深圳市倍思科技有限公司_202410421970.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

跨语言语音转换方法、装置、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务