首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向在线学习社区的学习兴趣发现方法_华中师范大学_202010776809.9 

申请/专利权人:华中师范大学

申请日:2020-08-05

公开(公告)日:2024-06-14

公开(公告)号:CN112101039B

主分类号:G06F16/9536

分类号:G06F16/9536;G06F40/30;G06F40/247;G06F40/284;G06F40/289;G06F40/295;G06F16/35;G06F18/22;G06Q50/20

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2021.01.05#实质审查的生效;2020.12.18#公开

摘要:本发明涉及计算机技术自然语言处理领域的文本挖掘技术,提供一种面向在线学习社区的学习兴趣发现方法,包括:采集在线学习社区中学习者生成的多维度行为和文本信息;融合领域知识命名实体词和学习情绪词进行文本分词;基于时序‑情绪‑主题的文本建模算法,挖掘与情绪和时序信息相关的兴趣主题概率分布;基于语义相似度计算方法,鉴别学习者的学习兴趣和非学习兴趣;根据应用场景,输出学习兴趣标签及其权重。本发明方法能有效发现学习者的学习兴趣,并显著提高学习兴趣的可解释性和准确性,有助于为学习者提供个性化的学习服务。

主权项:1.一种面向在线学习社区的学习兴趣发现方法,其特征在于该方法包括以下步骤:1采集在线学习社区中学习者生成的多维度行为和文本信息;2融合领域知识命名实体词和学习情绪词进行文本分词,包括:2-1通过筛选情绪词典的方法和人工标注的方法,获得学习情绪词典;所述学习情绪词典中包含积极、困惑和消极类别的词;2-2使用新词发现方法从网络课程的学习材料中获取领域知识相关的命名实体词,获得领域知识命名实体词典;2-3基于领域知识命名实体词典和学习情绪词典,对学习者生成内容进行分词,同时去除停用词和替换同义词;3基于时序-情绪-主题的文本建模算法,挖掘与情绪和时序信息相关的兴趣主题概率分布;所述基于时序-情绪-主题的文本建模算法,包括:3-1建构时间、情绪、主题、词汇多变量关联的概率图模型;3-2读入分词后的学习者生成内容和学习情绪词典,设置主题数量和其他超参数;3-3初始化句子的情绪类别和主题编号矩阵;3-4通过吉布斯采样的多次迭代,估计每个句子的情绪和主题;所述每个句子的情绪和主题的条件概率表示为: ;其中,E、T分别为情绪类别数量、主题数量;t、w是可观察到的发帖时间和帖子词;e、z是帖子隐含的情绪和主题,α、、、μ分别为潜在变量、、、的超参数,其中表示学习者发帖d-情绪j-主题k的概率分布,表示词汇w-情绪j-主题k的概率分布,表示学习者发帖d-情绪j的概率分布,表示情绪j-主题k-时间h的概率分布;3-5计算每个学习者发帖的情绪-主题分布、情绪-主题-词分布、情绪分布、情绪-主题-时序分布;具体的: ,,,;3-6计算主题数量评估曲线PS2EK,选取最优主题数量,所述最优主题数量为主题数量范围内的最小值;计算公式为:PS2EK=Perplexity˙SimilarityA˙SimilarityE˙EntropyKL;其中,Perplexity表示训练数据的拟合性能,SimilarityA表示不同主题分布的平均相关性,SimilarityE表示不同情绪分布在各主题间的平均相关性,Entropy表示各主题词分布的平均相关性,KL距离表示各主题词分布的平均差异;4基于语义相似度计算方法,鉴别学习者的学习兴趣和非学习兴趣;5根据应用场景,输出学习兴趣标签及其权重。

全文数据:

权利要求:

百度查询: 华中师范大学 一种面向在线学习社区的学习兴趣发现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。