首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于知识图谱的资源推荐系统及方法 

申请/专利权人:北京文华在线教育科技股份有限公司

申请日:2024-01-15

公开(公告)日:2024-06-25

公开(公告)号:CN117573894B

主分类号:G06F16/36

分类号:G06F16/36;G06Q50/20;G06F40/295;G06N3/09;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.03.08#实质审查的生效;2024.02.20#公开

摘要:本发明公开了一种基于知识图谱的资源推荐系统及方法,涉及教学资源推荐技术领域,包括:获取原始数据;对原始数据进行预处理,得到文本数据;训练得到基于BERT的全监督场景命名实体识别模型;抽取文本数据中的实体,并对抽取得到的实体进行标注分类后,存储至知识图谱实体库;获取输入的检索文本,并提取待匹配关键词;基于待匹配关键词,计算相似度得分;基于相似度得分输出与待匹配关键词相似度得分大于0的所有知识图谱中的实体资源。本发明的优点在于:利用学科知识图谱可以把知识点间的关系通过可视化的形式进行展示,进行构建完整的知识体系,并将输入的关键词在知识图谱中搜索一遍,找到直接相关的实体,进行基于词义的知识资源推荐。

主权项:1.一种基于知识图谱的教学资源推荐方法,其特征在于,包括:获取原始数据,所述原始数据至少包括课件资源、视频资源、教材资源以及学生个性化数据;对原始数据进行预处理,得到文本数据;训练得到基于BERT的全监督场景命名实体识别模型;将文本数据输入全监督场景命名实体识别模型,抽取文本数据中的实体,并对抽取得到的实体进行标注分类后,存储至知识图谱实体库;获取输入的检索文本,从检索文本中提取至少一个关键词,作为待匹配关键词;基于待匹配关键词,计算待匹配关键词与知识图谱中的实体资源的相似度得分;按照相似度得分从大到小的顺序,依次输出与待匹配关键词相似度得分大于0的所有知识图谱中的实体资源;所述基于待匹配关键词,计算待匹配关键词与知识图谱中的实体资源的相似度得分具体包括:分别计算待匹配关键词与知识图谱中的实体资源的标签种类占比、标签数量占比和资源得分,所述标签种类占比、标签数量占比和资源得分的取值范围均为[0,1];分别设置标签种类占比权重、标签数量占比权重和资源得分权重;按照标签种类占比权重、标签数量占比权重和资源得分权重,对标签种类占比、标签数量占比和资源得分进行加权求和,得到待匹配关键词与知识图谱中的实体资源的相似度;所述标签种类占比的计算方式为:将知识图谱中的实体资源的相同标签划分为同一标签种类;确定知识图谱中的实体资源的所有标签种类,记为资源标签种类;确定每个待匹配关键词对应的标签种类,记为待匹配关键词标签种类;通过种类占比公式计算待匹配关键词与知识图谱中的实体资源的标签种类占比;所述种类占比公式具体为:种类占比公式中,为标签种类占比,为待匹配关键词标签种类总数量,为资源标签种类总数量;所述标签数量占比的计算方式为:确定每个资源标签种类下对应的标签数量;通过数量占比公式计算待匹配关键词与知识图谱中的实体资源的标签数量占比;所述数量占比公式具体为:种类占比公式中,为标签数量占比,为第i个待匹配关键词标签种类下对应的标签数量,为第j个资源标签种类下对应的标签数量;所述资源得分的计算方式为:确定资源的总字符长度;确定每个待匹配关键词标签种类对应的标签字符长度;通过资源得分公式计算待匹配关键词与知识图谱中的实体资源的资源得分;所述资源得分公式具体为:种类占比公式中,为资源得分,为第i个待匹配关键词标签种类下对应的标签字符长度,为资源的总字符长度。

全文数据:

权利要求:

百度查询: 北京文华在线教育科技股份有限公司 一种基于知识图谱的资源推荐系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。