买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:暗物智能科技(广州)有限公司
摘要:本申请提供一种构建垂域知识图谱的方法及相关装置,利用预设信息抽取任务程序(通过任务界面来确定和调整知识图谱的目标垂域以及待抽取的任务信息)执行信息抽取,获得多样化数据源的非结构化数据;通过数据解析引擎对非结构化数据进行预处理,得到可处理的非结构化数据;依据自动标注模型对其进行初步信息标注,并对其进行审核与校正,得到校正后的结构化信息;利用相似度计算和模式匹配技术,在多样化数据源间传播已有的标注信息,并通过聚类技术进行多样化数据源间数据的聚类,得到目标结构化数据;然后生成并导出所述目标垂域对应的垂域知识图谱。本申请可优化垂域知识图谱的构建过程,并在特定领域内高效、准确地构建垂域知识图谱。
主权项:1.一种构建垂域知识图谱的方法,其特征在于,包括:利用预设信息抽取任务程序执行信息抽取,获得多样化数据源的非结构化数据,所述预设信息抽取任务程序通过任务界面来确定和调整知识图谱的目标垂域以及待抽取的任务信息;通过数据解析引擎对所述多样化数据源的非结构化数据进行预处理,得到可处理的非结构化数据;依据自动标注模型对所述可处理的非结构化数据进行初步信息标注,并对结构化的初步信息进行审核与校正,得到校正后的结构化信息,所述自动标注模型根据用户反馈模型进行更新和优化,所述用户反馈模型用于对所属自动标注模型进行更新和优化;利用相似度计算和模式匹配技术,在多样化数据源间传播已有的标注信息,并通过聚类技术进行多样化数据源间数据的聚类,得到目标结构化数据;根据所述目标结构化数据生成并导出所述目标垂域对应的垂域知识图谱;其中,所述预设信息抽取任务程序的建立,包括:通过获取用户需求创建信息抽取项目,并为所述信息抽取项目设定预设的信息抽取任务,并对预设的信息抽取任务进行动态任务调整;获取用户需求,根据所述用户需求为每个信息抽取任务设定相关参数来调整信息抽取策略,所述参数包括但不限于信息抽取任务的支持语言、目标垂域对应的垂域知识图谱的类型。
全文数据:
权利要求:
百度查询: 暗物智能科技(广州)有限公司 构建垂域知识图谱的方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。