首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】用于自然语言处理中的跨语种迁移的系统和方法_硕动力公司_202280067061.2 

申请/专利权人:硕动力公司

申请日:2022-11-14

公开(公告)日:2024-06-04

公开(公告)号:CN118140227A

主分类号:G06F40/30

分类号:G06F40/30;G06F40/45;G06N3/045;G06N3/0455;G06N3/084;G06N3/096;G06F40/289;G06F40/216

优先权:["20211115 US 63/279,476","20220121 US 17/581,380"]

专利状态码:在审-实质审查的生效

法律状态:2024.06.21#实质审查的生效;2024.06.04#公开

摘要:本文描述的实施例提供了一种跨语种语句对齐框架,其仅在资源丰富的语言对上训练。为了获得准确的对齐器,使用预训练的多语种语言模型,并且在来自资源丰富的语言对的并行数据上训练分类器。然后,经过训练的分类器可以用于资源匮乏的语言的跨语种迁移。

主权项:1.一种跨语种语句对齐的方法,所述方法包括:经由通信接口接收训练数据集,所述训练数据集至少包括源语言的第一语句和作为所述第一语句的翻译版本的目标语言的第二语句;形成包括所述第一语句和所述第二语句的正输入对以及多个负输入对,每个负输入对包括所述第一语句和所述目标语言的相应不匹配语句;经由预训练的多语种模型,计算每个正输入对或负输入对内的两个语句之间的成对令牌级相似度;基于与所述正输入对和所述多个负输入对相关联的经计算的成对令牌级相似度,计算损失目标;基于所述损失目标,更新所述预训练的多语种模型;和使用更新的预训练的多语种模型,在所述源语言与不同于所述目标语言的另一种语言之间执行对齐任务。

全文数据:

权利要求:

百度查询: 硕动力公司 用于自然语言处理中的跨语种迁移的系统和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术