Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种适合复杂异构系统的HPL的Panel分解优化方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院软件研究所

摘要:本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM以及Panel广播的优化加速Panel分解,其中Panel广播的优化包括避免数据封装和Panel广播流水两方面的优化。本发明将Panel广播流水与GPU加速Panel分解DGEMM协同使用,充分利用系统的CPU、GPU、PCIe和网络接口资源,提高了整个CPU+GPU复杂异构系统HPL测试程序的效率。

主权项:1.一种适合复杂异构系统的HPL的Panel分解优化方法,其特征在于,包括以下步骤:对与Panel分解计算有关的基本参数进行调优;利用调优后的基本参数,通过GPU加速Panel分解;对Panel广播进行优化,使得Panel数据广播与Panel分解计算并行处理;所述Panel分解使用递归算法,中间递归层次的浮点运算集中在BLAS的DTRSM和DGEMM两个函数,当递归层次包含的列数小于等于阈值时,使用非递归算法,浮点运算集中在BLAS的DGEMV、DTRSV、DSCAL、IDAMAX函数,其中DGEMM时间所占比例最大;DGEMM函数在Panel分解递归层次调用,根据Panel分解的left-looking算法,从左到右执行LU分解,左侧的subpanel完成分解之后,执行DGEMM,更新相同层次的右侧的subpanel,采用GPU加速DGEMM进行优化;所述采用GPU加速DGEMM进行优化,包括:首先把左侧subpanel和相应的U数据传输到GPU设备内存,然后执行DGEMM更新GPU内存的右侧subpanel,更新后数据传输到CPU端内存,然后继续执行后续的panel分解;所述对Panel广播进行优化,包括避免数据封装和Panel广播流水优化:所述避免数据封装,是通过使用二维复制接口把Panel数据复制到连续存储区域;Panel分解计算完成后,MPI接口直接使用缓冲区即连续存储区域的数据,从而达到避免数据封装的目的;所述Panel广播流水优化,是对已分解的subpanel数据提前发起广播,使得Panel数据广播与Panel分解计算并行。

全文数据:

权利要求:

百度查询: 中国科学院软件研究所 一种适合复杂异构系统的HPL的Panel分解优化方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术