首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种多语种语音翻译模型构建方法及翻译方法_镁佳(北京)科技有限公司_202410351891.9 

申请/专利权人:镁佳(北京)科技有限公司

申请日:2024-03-26

公开(公告)日:2024-06-18

公开(公告)号:CN118212924A

主分类号:G10L15/26

分类号:G10L15/26;G10L15/00;G10L15/06;G10L25/30;G06N3/096;G10L15/22

优先权:

专利状态码:在审-公开

法律状态:2024.06.18#公开

摘要:本发明涉及智能翻译技术领域,公开了一种多语种语音翻译模型构建方法及翻译方法,模型构建方法包括:使用目标语种文本数据对预设语音翻译模型进行预训练微调,得到目标语种的语言预训练模型,语言预训练模型包括第一编码器和第一解码器;将预设多语种语音识别模型作为教师模型进行知识蒸馏,得到蒸馏模型,蒸馏模型包括第二编码器和第二解码器;基于第二编码器和第一解码器构建目标语音翻译模型;使用预收集的音频数据对目标语音翻译模型进行训练,得到多语种语音翻译模型,本发明对目标语音翻译模型进行训练时只需要较少的数据对齐进行训练即可使模型收敛,从而减少训练所需数据,且训练得到的多语种语音翻译模型规模小,适用于车机领域。

主权项:1.一种多语种语音翻译模型构建方法,其特征在于,包括:使用目标语种文本数据对预设语音翻译模型进行预训练微调,得到目标语种的语言预训练模型,所述语言预训练模型包括第一编码器和第一解码器;将预设多语种语音识别模型作为教师模型进行知识蒸馏,得到蒸馏模型,所述蒸馏模型包括第二编码器和第二解码器;基于所述第二编码器和第一解码器构建目标语音翻译模型;使用预收集的音频数据对所述目标语音翻译模型进行训练,得到多语种语音翻译模型,所述音频数据包括预设语种音频及对应的原语种文本和目标语种文本。

全文数据:

权利要求:

百度查询: 镁佳(北京)科技有限公司 一种多语种语音翻译模型构建方法及翻译方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。