首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种数据认知方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大华技术股份有限公司

摘要:本申请实施例提供了一种数据认知方法、装置、设备及存储介质,涉及计算机技术领域,该方法包括:基于应用数据构建现实层子图,现实层子图包括多个应用实体,每个应用实体用于表征应用数据中一个应用数据单元。基于标准数据构建知识层子图,知识层子图包括多个标准实体,每个标准实体用于表征标准数据中一个标准数据单元。通过深度学习模型,确定现实层子图中的至少一个应用实体,分别在知识层子图中对应的标准实体;再将至少一个应用实体各自对应的标准实体的标准属性信息,分别添加至至少一个应用实体各自对应的属性信息集合中。相较于采用人工方法进行数据认知的方案来说,本申请的数据认知方法可以提高数据认知的准确性,提高数据认知的效率。

主权项:1.一种数据认知方法,其特征在于,包括:基于应用数据构建现实层子图,所述现实层子图包括多个应用实体,每个应用实体用于表征所述应用数据中一个应用数据单元,应用实体之间的连接关系用于表征应用数据单元之间的关联关系;所述应用数据包括现实层表和现实层字段,所述应用实体包括现实层表实体和现实层字段实体,其中,每个现实层表实体用于表征一个现实层表,每个现实层字段实体用于表征一个现实层字段;所述现实层表实体与所述现实层字段实体之间的连接关系用于表征一个现实层表对应一个或多个现实层字段;基于标准数据构建知识层子图,所述知识层子图包括多个标准实体,每个标准实体用于表征所述标准数据中一个标准数据单元,标准实体之间的连接关系用于表征标准数据单元之间的关联关系;所述标准数据包括数据项集、限定词和数据元,所述标准实体包括数据项集实体、限定词实体和数据元实体,其中,每个数据项集实体用于表征一个数据项集,每个限定词实体用于表征一个限定词,每个数据元实体用于表征一个数据元;针对所述现实层子图中的每个现实层表实体,通过第一深度学习模型,确定所述现实层表实体在所述知识层子图中对应的目标数据项集实体;所述第一深度学习模型是采用预先收集的现实层表对应的现实层表数据和数据项集对应的数据项集数据训练的,其中,所述现实层表数据是通过以下方式获得的:将所述现实层表的表名和所述现实层表的描述信息分别去除头尾空字符,再利用长文本分词工具,分别对所述现实层表的表名和所述现实层表的描述信息进行分词处理;针对所述现实层子图中的每个现实层字段实体,通过第二深度学习模型,确定所述现实层字段实体在所述知识层子图中对应的目标限定词实体;通过第三深度学习模型,确定所述现实层字段实体在所述知识层子图中对应的目标数据元实体;将至少一个应用实体各自对应的标准实体的标准属性信息,分别添加至至少一个应用实体各自对应的属性信息集合中。

全文数据:

权利要求:

百度查询: 浙江大华技术股份有限公司 一种数据认知方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。