申请/专利权人:中国电子科技集团公司第十研究所
申请日:2024-03-13
公开(公告)日:2024-06-14
公开(公告)号:CN118194157A
主分类号:G06F18/2415
分类号:G06F18/2415;G06F40/284;G06N3/0455;G06N3/096
优先权:
专利状态码:在审-公开
法律状态:2024.06.14#公开
摘要:本发明公开了一种基于小样本学习的多类型中文事件分类及要素抽取方法,该方法包括:预模型选择:将通用信息抽取模型作为中文事件分类模型的预模型,并根据该模型的统一数据结构设计语料标注接口;文本语料标注:对模型应用领域的真实语料进行标注;模型微调训练:通过标注好的文本语料对中文事件分类模型进行微调;模型迭代调优:通过实际应用开放领域事件抽取任务文本对微调后模型进行测试,根据事件抽取和元素提取结果,对文本语料进行迭代调整,以优化模型。本发明能够快速实现开放领域事件分类与事件要素抽取。
主权项:1.一种基于小样本学习的多类型中文事件分类及要素抽取方法,其特征在于,包括:步骤1:预模型选择:将通用信息抽取模型作为中文事件分类模型的预模型,并根据该模型的统一数据结构设计语料标注接口;步骤2:文本语料标注:对模型应用领域中小于预设数量的真实语料进行标注;步骤3:模型微调训练:通过标注好的文本语料对中文事件分类模型进行微调;步骤4:模型迭代调优:通过实际应用开放领域事件抽取任务文本对微调后模型进行测试,根据事件抽取和元素提取结果,对文本语料进行迭代调整,以优化模型。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第十研究所 基于小样本学习的多类型中文事件分类及要素抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。