首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

自然语言处理模型的训练方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京百度网讯科技有限公司

摘要:本申请公开了一种自然语言处理模型的训练方法、装置、设备及存储介质,涉及基于人工智能的自然语言处理领域。具体实现方案为:基于预设的语料集,构建指代消解任务的各条训练语料对,各训练语料对中包括正样本和负样本;采用各训练语料对,训练自然语言处理模型,使其学习识别对应的正样本和负样本的能力;采用各训练语料对的正样本,训练自然语言处理模型,使其学习指代消解任务的能力。本申请可以实现自然语言处理模型对指代消解任务进行建模,提升自然语言处理模型对指代消解任务的处理能力,丰富自然语言处理模型的功能,增强自然语言处理模型的实用性。

主权项:1.一种自然语言处理模型的训练方法,其中,所述方法包括:基于预设的语料集,构建指代消解任务的各条训练语料对,各所述训练语料对中包括正样本和负样本;在预训练阶段,采用各所述训练语料对,训练所述自然语言处理模型,使其学习识别对应的所述正样本和所述负样本的能力;在精调阶段,采用各所述训练语料对的正样本,训练所述自然语言处理模型,使其学习指代消解任务的能力;其中,基于预设的语料集,构建指代消解任务的各条训练语料对,包括:对于所述预设的语料集中的各条语料,将对应的所述语料中非首次出现的目标名词替换为代词,作为训练语料;从所述训练语料中获取其他名词;将所述训练语料以及所述代词指代所述目标名词的指代关系,作为所述训练语料对的正样本;将所述训练语料以及所述代词指代所述其他名词的指代关系,作为所述训练语料对的负样本;其中,采用各所述训练语料对的正样本,训练所述自然语言处理模型,使其学习指代消解任务的能力,包括:将各所述训练语料对的所述正样本的训练语料中的代词遮掩;将所述代词遮掩后的所述训练语料输入至所述自然语言处理模型中,使得所述自然语言处理模型预测所述代词属于所述训练语料中各名词的概率;基于所述自然语言处理模型预测所述代词属于所述训练语料中各名词的概率、以及所述正样本中标识的所述代词指代的目标名词,生成目标损失函数;判断所述目标损失函数是否收敛;若未收敛,基于梯度下降法调整所述自然语言处理模型的参数。

全文数据:

权利要求:

百度查询: 北京百度网讯科技有限公司 自然语言处理模型的训练方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。