首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于Airflow的数据计算调度方法_南方电网科学研究院有限责任公司_201911005641.5 

申请/专利权人:南方电网科学研究院有限责任公司

申请日:2019-10-22

公开(公告)日:2024-06-21

公开(公告)号:CN110764747B

主分类号:G06F8/30

分类号:G06F8/30;G06F16/27

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2021.08.10#专利申请权的转移;2020.03.03#实质审查的生效;2020.02.07#公开

摘要:本发明公开了基于Airflow的数据计算调度方法,属于Airflow技术领域,包括以下步骤:步骤一:开始任务,生成树,任务实例并导出原始数据;步骤二:生成树,任务实例接着进行scheduler安排定时服务同时,Dag生成定义任务和依赖与scheduler扫描定时服务同时输入至所有任务存储在数据库中判断是否满足定时条件,当满足定时条件时解析模型;步骤三:当导出原始数据成功时向下进行数据计算1同时将数据存储到HDFS且HDFS获取数据。本发明具有强大的依赖关系设计和强大的拓展性并且允许触发任意的脚本,基础模块也被设计的非常容易拓展。

主权项:1.基于Airflow的数据计算调度方法,其特征在于,包括以下步骤:步骤一:开始任务,生成树,任务实例并导出原始数据;程序通过参数,导入相应日期的数据分别计算出厂站终端抄表率明细、用户终端抄表率明细、厂站终端抄表率和低压级超终端抄表率;生成一个实例包括:数据导入日冻结、计算计量点电量和计算分析对象电量,具体包括:运行电能表,将数据导入日冻结中的数据进行计量点电量计算,当数据导入完成,任务被标记为success,当多个计算需要用到同一个数据源时,开始执行分析对象电量,当分析对象电量执行完毕后开始计算数据;步骤二:生成树,任务实例接着进行scheduler安排定时服务同时,Dag生成定义任务和依赖与scheduler扫描定时服务同时输入至所有任务存储在数据库中判断是否满足定时条件,当满足定时条件时解析模型;步骤三:当导出原始数据成功时向下进行数据计算1同时将数据存储到HDFS且HDFS获取数据,当导出原始数据失败时定时任务失败同时任务日志记录到源数据库中;步骤四:当数据计算1成功时既向下进行数据计算2、数据计算3、数据计算4和数据计算5,又将数据计算1的计算结果保存到HDFS,及mpp;步骤五:HDFS获取结果数据与数据计算2、数据计算3、数据计算4和数据计算5同时并行任务,同时将存储过程入库并数据存储至HDFS及Mpp。

全文数据:

权利要求:

百度查询: 南方电网科学研究院有限责任公司 基于Airflow的数据计算调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。