基于大语言模型的幂等机制生成教育文本摘要方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：武汉理工大学

摘要：本发明提供基于大语言模型的幂等机制生成教育文本摘要方法，属于人工智能和自然语言处理领域，包括：收集多个数据源的语料，选择待摘要源文本；构建文本摘要模板；设计下游文本摘要的提示词，形成第一文本摘要；将第一文本摘要输入到大语言模型中，获得生成摘要及微调损失；根据单词序列的长度随机生成噪声文本，获得初次摘要；将初次摘要与下游文本摘要的提示词填充进文本摘要模板中形成第三文本摘要，将第三文本摘要输入至大语言模型，获得幂等摘要及幂等损失；将幂等损失加入微调损失中形成总体损失，将总体损失收敛作为训练截止条件，完成大语言模型的微调训练。本发明能解决教育垂域数据稀缺、摘要长度不稳定导致信息缺失或冗余的问题。

主权项：1.一种基于大语言模型的幂等机制生成教育文本摘要方法，其特征在于，包括以下步骤：S1收集多个数据源的语料，并初始化语料权重，根据语料权重选择待摘要源文本；S2构建文本摘要模板，包括提示词模板和源文本模板；S3设计下游文本摘要的提示词，将下游文本摘要的提示词与待摘要源文本填充进文本摘要模板中形成第一文本摘要；S4将第一文本摘要输入到大语言模型中，对第一文本摘要进行分词处理后得到单词序列，并将单词序列转换为索引表，以对大语言模型进行微调，获得生成摘要及微调损失；S5根据单词序列的长度随机生成噪声文本，将噪声文本作为源文本填充至文本摘要模板中，得到第二文本摘要，将第二文本摘要输入至大语言模型，获得初次摘要；S6将初次摘要与下游文本摘要的提示词填充进文本摘要模板中形成第三文本摘要，将第三文本摘要输入至大语言模型，获得幂等摘要及幂等损失；S7将幂等损失加入微调损失中形成总体损失，将总体损失收敛作为训练截止条件，完成大语言模型的微调训练；步骤S1包括：S11收集多个数据源的语料D=D1、D2…Dn，初始化语料权重W=W1、W2…Wn，其中，n为数据源的个数；S12将语料权重进行两两比较，选择最优的数据源的语料，两两比较的公式为：；其中，Wi、Wj表示Di、Dj对应的语料权重，若，则选择数据源Di，并将其对应的文本摘要数据ti,si作为训练对象，若，则选择数据源Dj，并将其对应的文本摘要数据tj,sj作为训练对象，t表示对应文本摘要数据中的源文本，s表示对应文本摘要数据中的参考摘要；S13加载最优的数据源的语料作为训练目标进行训练，计算梯度反向传播，调整语料权重，并返回步骤S12重新比较语料权重；S14输出得到最终的一批最优数据源的语料，将其源文本作为待摘要源文本；步骤S4包括：S41创建分词器，将第一文本摘要进行分词处理，处理后的结果表示为分词表；S42将处理后的分词表输入分词器，将分词表映射为全部由数字组成的索引表；S43创建词嵌入模型，将词嵌入模型初始化；S44创建MLP模型，使用Sequential容器顺序连接两层线性层与Tanh激活函数组层MLP模型；S45将词嵌入模型与MLP模型组成前缀编码器PrefixEncoder；S46随机初始化前缀token，输入到前缀编码器PrefixEncoder，获得前缀KV缓存；S47训练阶段冻结除前缀编码器PrefixEncoder之外的所有梯度；S48预测得到生成摘要，与参考摘要进行对比，计算得到微调损失。

全文数据：

权利要求：

百度查询：武汉理工大学基于大语言模型的幂等机制生成教育文本摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：声纳图像的可视化处理方法、系统和计算装置

下一篇：一种重型机械龙门自动焊接装置

相关技术

声纳图像的可视化处理方法、系统和计算装置

一种重型机械龙门自动焊接装置

一种鞘管弹簧丝绕制装置

一种变电站无人机巡视路径规划方法及系统

一种生物质燃料防结焦气化燃烧炉

一种行星齿轮减速机

用于车辆空调系统的控制方法、装置、程序产品及介质

一种盾构壁后注浆浆液及其制备方法

一种黄芩病虫害识别系统及方法

电池单体、储能设备及用电装置

一种葡萄糖传感器及其制备方法

一种神经内科用可缓解神经痛的助眠装置

生成相关技术

轨道生成装置_三菱电机株式会社_202380018918.6

气溶胶生成装置_深圳市合元科技有限公司_202323518750.1

气溶胶生成系统_深圳市合元科技有限公司_201910711181.1

气溶胶生成装置_深圳市合元科技有限公司_202323543129.0

气溶胶生成装置_深圳市合元科技有限公司_202323093499.9

气溶胶生成装置_深圳市合元科技有限公司_202323662257.7

数据生成设备和程序_日本电信电话株式会社_202180104085.6

数据生成模型获取方法_珠海金山数字网络科技有限公司_202410682552.9

图像生成模型训练方法和装置、图像生成方法和装置_上海游境网络科技有限公司_202011396520.0

数字指纹生成电路、生成方法和电子设备_京东方科技集团股份有限公司_202010788358.0

机制相关技术

一种机制砂多级分选装置_武汉亿庆盛建材有限公司_202420009628.7

一种机制砂在线检测装置_保利长大工程有限公司_202410957940.3

一种基于自注意力机制的显著目标检测方法_南京理工大学_202111278451.8

一种嵌入式系统的参数存储机制_微网智控(北京)科技有限公司_202011481455.1

基于选择排序感知注意力机制的红外小目标检测方法_河南工业大学_202410751251.7

一种基于注意力机制的近海藻华爆发预测方法_浙江农林大学_202410710814.8

一种基于对抗训练注意力机制的人体动作预测方法_大连理工大学_202210047220.4

确定沉积变质型铁矿成矿机制的方法及系统_青海省地质调查院(青海省地质矿产研究院、青海省地质遥感中心)_202410043946.X

具有周期性感应功能自检机制的照明装置及其方法_厦门普为光电科技有限公司_202411101609.8

基于多层注意力机制的跨模态检索模型的构建方法及应用_华中科技大学_202110995974.8

教育相关技术

一种教育培训用书写白板_陕西唯真教育科技(集团)有限公司_202323505882.0

土壤液化地质灾害科普教育的演示装置_上海师范大学_202410886213.2

一种基于学习算法的智能教育设备的引导方法与系统_中电数科科技有限公司_202411116916.3

一种基于虚拟显示技术的心理健康教育系统_西安体育学院_202410757412.3

基于大语言模型的幂等机制生成教育文本摘要方法_武汉理工大学_202410332199.1

一种基于智慧教育的智能讲台系统_深圳市凯博特科技有限公司_202410719985.7

基于托管教育平台的学生安全预警方法、系统及存储介质_广州今之港教育咨询有限公司_202410485689.5

一种基于美术教育的绘画板颜料清洗装置_南京丹舟孚电子科技有限公司_202410886793.5

一种基于企业资源的职业教育的管理方法以及设备_北京游娱教育信息科技有限公司_202410642102.7

一种基于职业教育智能化公共实训平台的构建方法及系统_成都工业职业技术学院_202411098729.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于大语言模型的幂等机制生成教育文本摘要方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务