首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于大语言模型的幂等机制生成教育文本摘要方法_武汉理工大学_202410332199.1 

申请/专利权人:武汉理工大学

申请日:2024-03-22

公开(公告)日:2024-06-18

公开(公告)号:CN118211580A

主分类号:G06F40/186

分类号:G06F40/186;G06F40/284;G06F18/214

优先权:

专利状态码:在审-公开

法律状态:2024.06.18#公开

摘要:本发明提供基于大语言模型的幂等机制生成教育文本摘要方法,属于人工智能和自然语言处理领域,包括:收集多个数据源的语料,选择待摘要源文本;构建文本摘要模板;设计下游文本摘要的提示词,形成第一文本摘要;将第一文本摘要输入到大语言模型中,获得生成摘要及微调损失;根据单词序列的长度随机生成噪声文本,获得初次摘要;将初次摘要与下游文本摘要的提示词填充进文本摘要模板中形成第三文本摘要,将第三文本摘要输入至大语言模型,获得幂等摘要及幂等损失;将幂等损失加入微调损失中形成总体损失,将总体损失收敛作为训练截止条件,完成大语言模型的微调训练。本发明能解决教育垂域数据稀缺、摘要长度不稳定导致信息缺失或冗余的问题。

主权项:1.一种基于大语言模型的幂等机制生成教育文本摘要方法,其特征在于,包括以下步骤:S1收集多个数据源的语料,并初始化语料权重,根据语料权重选择待摘要源文本;S2构建文本摘要模板,包括提示词模板和源文本模板;S3设计下游文本摘要的提示词,将下游文本摘要的提示词与待摘要源文本填充进文本摘要模板中形成第一文本摘要;S4将第一文本摘要输入到大语言模型中,对第一文本摘要进行分词处理后得到单词序列,并将单词序列转换为索引表,以对大语言模型进行微调,获得生成摘要及微调损失;S5根据单词序列的长度随机生成噪声文本,将噪声文本作为源文本填充至文本摘要模板中,得到第二文本摘要,将第二文本摘要输入至大语言模型,获得初次摘要;S6将初次摘要与下游文本摘要的提示词填充进文本摘要模板中形成第三文本摘要,将第三文本摘要输入至大语言模型,获得幂等摘要及幂等损失;S7将幂等损失加入微调损失中形成总体损失,将总体损失收敛作为训练截止条件,完成大语言模型的微调训练。

全文数据:

权利要求:

百度查询: 武汉理工大学 基于大语言模型的幂等机制生成教育文本摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。