首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向高性能计算的矩阵分解并行化优化方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明公开了一种面向高性能计算的矩阵分解并行化优化方法及系统,涉及数据处理技术领域,包括构建矩阵特征提取器,从输入的大规模气象数据矩阵中自动提取关键特征;基于提取的关键特征构建层次贝叶斯网络模型,通过概率推理确定矩阵分解的最优并行化方案;针对确定的并行化方案,采用自适应代码变换技术动态生成并行代码;引入分块分级并行调度策略,将气象数据矩阵的运算任务分解为不同粒度的任务块,并根据生成的并行代码将任务块分级调度到多个异构计算单元中;采用基于工作窃取机制的细粒度动态负载均衡策略,实时调整矩阵分解任务的分配。本发明实现了基于特征量化和概率模型的智能并行策略自动选择,避免了人工经验选择的低效和盲区。

主权项:1.一种面向高性能计算的矩阵分解并行化优化方法,其特征在于:包括,构建矩阵特征提取器,从输入的大规模气象数据矩阵中自动提取关键特征;基于提取的关键特征构建层次贝叶斯网络模型,通过概率推理确定气象数据矩阵分解的最优并行化方案,所述最优并行化方案为并行化算法、并行粒度和并行策略的最优组合;针对确定的最优并行化方案,采用自适应代码变换技术,根据超级计算机集群中各类硬件加速器的架构特性,动态生成并行代码;引入分块分级并行调度策略,将气象数据矩阵的运算任务分解为不同粒度的任务块,并根据生成的并行代码将任务块分级调度到超级计算机集群的多个异构计算单元中;在各异构计算单元中,采用基于工作窃取机制的细粒度动态负载均衡策略,自适应调整气象数据矩阵分解任务的分配,以充分利用计算资源;建立反馈优化机制,在气象数据矩阵分解过程中持续收集计算性能数据,并根据计算性能数据动态调整层次贝叶斯网络模型参数;所述通过概率推理确定气象数据矩阵分解的最优并行化方案包括以下步骤:对提取的关键特征进行量化评估,分析其对并行计算性能的影响程度,确定各关键特征的权重系数;构建一个并行策略知识库,所述并行策略知识库包括各种适用于气象数据矩阵分解的并行化算法、并行粒度和并行策略的优缺点分析和适用场景介绍;构建层次贝叶斯网络模型,将气象数据矩阵的关键特征作为证据节点,并行化方案S作为目标节点;在层次贝叶斯网络模型框架内,使用权重系数对各种并行化方案S进行概率推理和条件概率计算;从概率分布中选择概率最大的前N个并行化方案输出;对所选的N个并行化方案进行二次评估,并根据评估结果返回最优并行化方案;所述二次评估包括,若N个并行化方案中,最大性能与最小性能差值超过预设阈值,则返回预期性能损失最小的方案作为最优并行化方案;若N个并行化方案中,最大性能与最小性能差值未超过预设阈值,则综合考虑包括能耗、系统负载在内的附加条件,返回满足附加约束的方案作为最优并行化方案;持续跟踪实际气象数据矩阵分解的并行化执行过程,收集反馈数据,按预设周期更新层次贝叶斯网络模型的参数,以动态调整并行化方案的选择;所述动态生成并行代码包括以下步骤:针对气象超级计算机集群中的目标异构加速平台和最优并行化方案确定的并行化算法,分别构建硬件架构描述和算法计算表示;建立算法计算表示与硬件架构描述之间的映射关系模型,定义并行矩阵分解计算任务到异构硬件资源的映射方式和映射约束;针对映射关系模型,构建算法-架构亲和性分析模块,自动识别矩阵分解并行化算法与目标架构间的亲和匹配特征;建立代码变换策略模板库T,根据亲和匹配特征,设计并构建对应气象数据矩阵分解的程序变换策略模板;针对每种目标异构加速平台,从代码变换策略模板库T中选取最佳匹配的程序变换策略模板,对原始并行化算法代码执行程序转换,生成目标异构并行代码;针对生成的目标异构并行代码,调用与目标平台相对应的编译工具链,生成可执行的目标二进制指令流;采用符号执行技术分析二进制指令流的执行特征,若存在偏差则反馈至代码变换策略模板库T,重新生成并行代码;将通过验证的并行代码分发部署到目标异构加速平台的相应异构硬件执行单元上。

全文数据:

权利要求:

百度查询: 南京邮电大学 一种面向高性能计算的矩阵分解并行化优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。