首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于神经网络早退机制的序列标注加速方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:复旦大学

摘要:本发明提供了一种基于神经网络早退机制的序列标注加速方法,用于判断预训练语言模型在进行序列标注任务时是否进行早退,包括以下步骤:对于L层的预训练语言模型,在每一层之后都添加一个内部分类器,在进行序列标注任务时,通过句子级别的序列标注早退机制或词级别的序列标注早退机制来判断预训练语言模型是否进行早退。本发明的一种基于神经网络早退机制的序列标注加速方法能够应用于在自然语言处理中较为基础的序列标注任务,在加速3‑4倍的同时只给模型带来微小的性能损失。

主权项:1.一种基于神经网络早退机制的序列标注加速方法,用于判断预训练语言模型在进行序列标注任务时是否进行早退,其特征在于,包括以下步骤:对于L层的所述预训练语言模型,在每一层之后都添加一个内部分类器,在进行所述序列标注任务时,通过句子级别的序列标注早退机制或词级别的序列标注早退机制来判断所述预训练语言模型是否进行早退,其中,所述句子级别的序列标注早退机制包括句子级别训练阶段与句子级别推理阶段,所述句子级别训练阶段为联合训练L层的所述预训练语言模型和添加的L个所述内部分类器,所述句子级别推理阶段为:当所述预训练语言模型执行至第L层,根据第L层输出的各个词的标签概率分布计算得到每个词的不确定度,然后最大池化得到整个句子的不确定度,并根据早退不确定度界限来判断是否退出,所述词级别的序列标注早退机制包括词级别训练阶段与词级别推理阶段,所述词级别训练阶段为先进行所述内部分类器的联合训练,再进行自采样训练,所述词级别推理阶段为通过计算每个词的窗口不确定度并根据最小退出不确定度来对每个词的退出进行单独判断,且每经过所述预训练语言模型的一层,就对未退出的词进行标签分类,若未退出的词的预测标签的分布置信度够高,则直接输出所述预测标签,并停止表示更新,直接复制到后续层。

全文数据:

权利要求:

百度查询: 复旦大学 一种基于神经网络早退机制的序列标注加速方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。