买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉美和易思数字科技有限公司
摘要:本发明提出了一种基于大数据的学习心得评测方法及装置。包括:获取本地历史关键词数据,根据本地历史关键词数据建立关键词分数表;建立关键词提取算法,获取学生学习心得文本数据,对该学习心得文本数据进行预处理,获取待计算文本数据,通过关键词提取算法从待计算文本数据中提取待评测关键词;根据关键词分数表对待评测关键词进行评测。本发明通过建立关键词提取算法提取待评测关键词,同时利用建立的关键词分数表对待评测关键词进行评测,能够精确对学生学习心得进行评测,同时也减少了人力消耗。
主权项:1.一种基于大数据的学习心得评测方法,其特征在于:包括以下步骤:S1,获取本地历史关键词数据,根据本地历史关键词数据建立关键词分数表;所述本地历史关键词数据包括:本地历史关键词、历史关键词对应的类别,所述历史关键词对应的类别包括:语文、数学、地理、物理、化学以及生物,根据历史关键词对应的类别建立不同类别集合;根据历史关键词对应的类别获取对应的课程目录,根据该对应的课程目录建立不同的课程子集合,并存储对应的本地历史关键词,根据该不同类别集合建立关键词分数表;关键词分数表由管理员进行设定,后期由系统根据存储的本地关键词数据库进行自动更新,关键词分数表是根据关键词的专业度进行评分,分为本专业关键词和通用关键词,本专业关键词的分数为5分,通用关键词指一些领域共用的关键词,通用关键词分数为3分,由此建立对应的关键词分数表,用于对学习心得进行评测;S2,建立关键词提取算法,获取学生学习心得文本数据,对该学习心得文本数据进行预处理,获取待计算文本数据,通过关键词提取算法从待计算文本数据中提取待评测关键词;其中,建立关键词提取算法,获取学生学习心得文本数据,对文本数据进行去干扰符号、分词、去停用词以及还原词干,获取处理之后的文本数据作为待计算文本数据,获取本地关键词词库,通过关键词提取算法利用待计算文本数据以及本地关键词词库中计算关键词相似度,根据相似度将该关键词作为待评测关键词并从待计算文本数据提取对应关键词;其中,对文本数据进行去干扰符号,所述干扰符号包括:标点符号、换行符号、格式符号以及标签符号,建立分词规则,根据分词规则从去除了干扰符号的文本数据提划分分词,设定停用词模型,所述停用词包括:连词、副词以及语气词,根据停用词模型从划分了分词的文本数据中去除停用词,并对文本数据的语言进行检测,当文本数据的语言为中文时,将去除了停用词的文本数据为待计算文本数据;当文本数据的语言为外文时,通过还原词干对去除了停用词的文本数据进行还原,将还原之后的文本数据为待计算文本数据;S3,根据关键词分数表对待评测关键词进行评测;其中,根据关键词分数表获取待评测关键词对应的分数,并计算待评测关键词的总分数作为学生学习心得文本数据的评测分数。
全文数据:
权利要求:
百度查询: 武汉美和易思数字科技有限公司 一种基于大数据的学习心得评测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。