首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于OpenMP Offload的性能优化方法、装置及电子设备 

申请/专利权人:郑州大学

申请日:2023-11-07

公开(公告)日:2024-01-16

公开(公告)号:CN117407169A

主分类号:G06F9/50

分类号:G06F9/50;G06N20/10

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.02#实质审查的生效;2024.01.16#公开

摘要:本发明公开了一种OpenMPOffload的性能优化方法、装置及电子设备,该方法包括:先确定所述OpenMPOffload在异构计算时生成的核函数个数,并确定出每个核函数的特征,所述特征具体包括循环计算上界、循环计算下界、是否存在规约以及与其他核函数之间是否存在依赖关系;将所述特征输入到预设学习模型中,通过所述预设学习模型将所有核函数进行融合;最后将融合后的核函数发送至并行执行域后确定出所述融合后的核函数对应的待执行程序的程序特征,通过所述预设学习模型根据该程序特征分配线程数和线程块数。通过先减少核函数的个数,然后基于核函数对应的待执行程序的特征进行线程和线程块的动态分配,有效地提高了OpenMPOffload的性能和异构架构系统线程资源的利用率。

主权项:1.一种用于OpenMPOffload的性能优化方法,其特征在于,所述方法包括:确定所述OpenMPOffload在异构计算时生成的核函数个数,并确定出每个核函数的特征,所述特征具体包括循环计算上界、循环计算下界、是否存在规约以及与其他核函数之间是否存在依赖关系;将所述特征输入到预设学习模型中,通过所述预设学习模型将所有核函数进行融合;将融合后的核函数发送至并行执行域后确定出所述融合后的核函数对应的待执行程序的程序特征,通过所述预设学习模型根据该程序特征分配线程数和线程块数。

全文数据:

权利要求:

百度查询: 郑州大学 一种用于OpenMP Offload的性能优化方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。