买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浪潮智慧科技有限公司
摘要:本申请公开了一种原始结构化数据智能处理方法、设备及存储介质,属于大数据处理技术的技术领域。方法包括:连接外部数据库,以获取外部数据库中的预存的原始结构化数据;基于预设的数据清洗算法清洗原始结构化数据,以获取有效原始结构化数据;将有效原始结构化数据按预设的最小功能单元进行拆分,并按照数据关系进行重组,以获取重组数据;基于预设的业务视图生成算法处理重组数据,以获取业务视图;基于业务视图处理重组数据,以判断重组数据是否存在风险;在重组数据存在风险时,确定风险的等级,并基于风险的等级处理重组数据。本申请通过上述方法实现了直观的查阅并智能处理原始结构化数据的效果。
主权项:1.一种原始结构化数据智能处理方法,其特征在于,所述方法包括:连接外部数据库,以获取所述外部数据库中的预存的原始结构化数据;其中原始结构化数据包括数据对象、数据属性、数据关系和数据事件;基于预设的数据清洗算法清洗所述原始结构化数据,以获取有效原始结构化数据;将所述有效原始结构化数据按预设的最小功能单元进行拆分,并按照所述数据关系进行重组,以获取重组数据;基于预设的业务视图生成算法处理所述重组数据,以获取业务视图;基于所述业务视图处理所述重组数据,以判断所述重组数据是否存在风险;在所述重组数据存在风险时,确定所述风险的等级,并基于所述风险的等级处理所述重组数据;基于预设的数据清洗算法清洗所述原始结构化数据,以获取有效原始结构化数据,具体包括:查阅所述外部数据库中各原始结构化数据之间的数据关联关系,以获取所述原始结构化数据内各项数据的重要程度和原始结构化数据应有的数据种类;其中,所述重要程度包括重要数据和非重要数据;基于所述数据种类处理所述原始结构化数据,以判断所述原始结构化数据是否缺失;在所述原始结构化数据缺失时,基于所述重要程度和数据种类的数量判断所述原始结构化数据是否为有效原始结构化数据;在所述原始结构化数据为有效原始结构化数据时,保留所述原始结构化数据;在所述原始结构化数据缺失时,基于所述重要程度和数据种类的数量判断所述原始结构化数据是否为有效原始结构化数据,具体包括:在所述原始结构化数据缺失时,基于所述数据种类和重要程度,确定所述原始结构化数据缺失的数据的数量,以及缺失的数据的重要程度;当存在所述缺失的数据为重要数据时,判断所述原始结构化数据为无效原始结构化数据;当所述缺失的数据均为非重要数据,且缺失的数据的数量大于预设的数量阈值时,判断所述原始结构化数据为无效原始结构化数据;当所述缺失的数据均为非重要数据,且缺失的数据的数量小于等于预设的数量阈值时,判断所述原始结构化数据为有效原始结构化数据;将所述有效原始结构化数据按预设的最小功能单元进行拆分,并按照所述数据关系进行重组,以获取重组数据,具体包括:基于最小功能单元拆分所述有效原始结构化数据,以获取拆分数据集;其中,所述拆分数据集包括数据对象、数据属性、数据关系和多个数据事件;所述数据对象和数据关系为重要数据,所述数据属性和多个数据事件为非重要数据;将所述缺失的数据补充至所述数据事件和数据属性,并标注所述缺失的数据为缺失数据;标注所述数据对象为主键,所有非重要数据为业务字段;按照预设的组合算法处理所述主键与业务字段,以获取多个初步重组数据,并基于数据关系判断所述初步重组数据是否为重组数据,并在所述初步重组数据为重组数据的情况下,保留所述重组数据。
全文数据:
权利要求:
百度查询: 浪潮智慧科技有限公司 一种原始结构化数据智能处理方法、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。