Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于自监督学习的大模型初中英语完形填空生成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京光年无限科技有限公司

摘要:本发明公开了一种基于自监督学习的大模型初中英语完形填空生成方法,包括S1、收集英语文本数据作为训练数据集及各省市10年内中考完形填空真题作为文本改编学习数据集;S2、形成出题词汇表;S3、并对训练数据集进行预处理;S4、使用自监督学习方法构建大规模自然语言处理模型;S5、根据训练数据集及文本改编学习数据集对大规模自然语言处理模型进行任务微调;S6、基于训练好的大规模自然语言处理模型及改编后的文本自动生成初中英语完形填空题目;S7、对生成的完形填空题目进行自动校验和人工审核;S8、将生成的完形填空题目存储在题库中。本发明利用自监督学习和大规模自然语言处理模型,高效地生成大量完形填空题目,极大地节省了人力和时间成本。

主权项:1.一种基于自监督学习的大模型初中英语完形填空生成方法,其特征在于,包括以下步骤:S1、收集大量未标注的英语文本数据作为训练数据集及各省市10年内中考完形填空真题作为文本改编学习数据集;S2、收集并整理初中各个英语教材版本的词汇按照单元机课时的词性词义及黑体重点词汇排布好形成出题词汇表;S3、并对训练数据集进行预处理,所述预处理包括去除噪声数据、分词和标注词性;S4、使用自监督学习方法结合预处理后的训练数据集构建大规模自然语言处理模型,并对大规模自然语言处理模型进行预训练,所述自监督学习方法包括遮挡预测任务和对比学习任务,所述遮挡预测任务包括随机遮挡英语文本数据中的部分单词,并让大规模自然语言处理模型预测被遮挡的单词,所述对比学习任务包括构建正负样本对,通过最大化正样本对的相似度和最小化负样本对的相似度进行训练;S5、根据训练数据集及文本改编学习数据集对大规模自然语言处理模型进行任务微调,所述任务微调包括将预训练的大规模自然语言处理模型应用于英语完形填空题目文本素材的改编及题目的生成任务,通过监督学习方法对大规模自然语言处理模型进行进一步优化,使其能够生成符合初中英语教学需求的完形填空题目;S6、基于训练好的大规模自然语言处理模型及改编后的文本自动生成初中英语完形填空题目,包括选择合适的文本段落作为基础材料,并在文本中基于出题词汇表随机选择若干单词进行遮挡,生成具有选项的完形填空题目;S7、对生成的完形填空题目进行自动校验和人工审核,确保题目的难度和内容适合初中生的学习需求,所述自动校验包括对生成题目的语法正确性和语义合理性进行检查,所述人工审核包括由英语教学专家对题目进行评估和修改;S8、将生成的完形填空题目存储在题库中,并根据初中生的学习数据和表现,动态调整和分发题目。

全文数据:

权利要求:

百度查询: 北京光年无限科技有限公司 一种基于自监督学习的大模型初中英语完形填空生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。