首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】翻译模型的训练方法及翻译模型的装置_腾讯科技(深圳)有限公司_202110125748.4 

申请/专利权人:腾讯科技(深圳)有限公司

申请日:2021-01-29

公开(公告)日:2024-06-07

公开(公告)号:CN113591493B

主分类号:G06F40/58

分类号:G06F40/58;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2022.10.11#实质审查的生效;2021.11.02#公开

摘要:本公开涉及人工智能服务领域,更具体地涉及一种翻译模型的训练方法、一种包括翻译模型的装置、电子设备及计算机可读存储介质。所述翻译模型的训练方法,所述方法基于第一语料对样本集和第二语料对样本集,获取第三语料对样本集,其中,所述第三语料对样本集中的每个第三语料对样本是由具有相同语义的混合语种文本和第二语种文本组成的文本对,所述混合语种文本包括一个或多个第一语种词语和一个或多个第三语种词语;并利用所述第三语料对样本集来对所述翻译模型进行训练。本公开的训练方法能够使得翻译模型能够学习到足够多的与低资源语种相关的信息,进而提高对低资源语种的翻译效果。

主权项:1.一种翻译模型的训练方法,包括:获取第一语料对样本集,其中,所述第一语料对样本集中的每个第一语料对样本是由具有相同语义的第一语种文本和第二语种文本组成的文本对;获取第二语料对样本集,其中,所述第二语料对样本集中的每个第二语料对样本是由具有相同语义的第三语种文本和第二语种文本组成的文本对;基于第一语料对样本集和第二语料对样本集,获取第三语料对样本集,其中,所述第三语料对样本集中的每个第三语料对样本是由具有相同语义的混合语种文本和第二语种文本组成的文本对,所述混合语种文本包括一个或多个第一语种词语和一个或多个第三语种词语;以及利用所述第三语料对样本集来对所述翻译模型进行训练,其中,所述利用所述第三语料对样本集来对所述翻译模型进行训练还包括:在第一训练阶段,利用所述第一语料对样本集来对所述翻译模型进行训练,以获取第一经训练的翻译模型;在第二训练阶段,利用所述第三语料对样本集来对所述第一经训练的翻译模型进行训练,以获取第二经训练的翻译模型;以及在第三训练阶段,利用所述第二语料对样本集来对所述第二经训练的翻译模型进行训练。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 翻译模型的训练方法及翻译模型的装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。