首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于寄存器度量的GPU计算单元共享存储器大小测算方法 

申请/专利权人:北京麟卓信息科技有限公司

申请日:2024-04-30

公开(公告)日:2024-06-28

公开(公告)号:CN118113487B

主分类号:G06F9/50

分类号:G06F9/50;G06F8/53

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.06.18#实质审查的生效;2024.05.31#公开

摘要:本发明公开了基于寄存器度量的GPU计算单元共享存储器大小测算方法,构建使用共享存储器及寄存器的核函数,以较大步长逐步增加核函数所占空间大小分析寄存器使用量的变化,当使用量突增时以此时的空间大小为起点以较小步长增加所占空间大小后再分析寄存器使用量的变化,当使用量不再增大时构建使用多个寄存器的核函数以此时的空间大小为起点逐渐减小占用空间大小,记录执行时间,当执行时间明显缩短时说明当前空间大小即为共享存储器的实际空间大小,实现了不依赖GPU提供的硬件信息查询接口,而是以软件方式准确地度量GPU内计算单元共享存储器的实际空间大小,为相关计算程序优化提供了准确的参数支撑。

主权项:1.基于寄存器度量的GPU计算单元共享存储器大小测算方法,其特征在于,具体包括以下步骤:步骤1、构建用于建立局部变量及共享存储器的第一核函数,其中,使用常量初始化共享存储器,将共享存储器的空间大小记为第一空间大小,第一空间大小可改变,局部变量的取值由共享存储器中的数据改变;步骤2、令第一空间大小为第一初值,设置第一步长的值,令本轮寄存器数量的取值为0,令上轮寄存器数量的取值为0;步骤3、编译第一核函数得到二进制代码,再对该二进制代码进行反编译得到待分析代码,记录待分析代码中寄存器数量作为本轮寄存器数量;步骤4、若本轮寄存器数量与上轮寄存器数量之差的绝对值小于第一阈值,则以本轮寄存器数量更新上轮寄存器数量,再令第一空间大小自加第一步长后执行步骤3;否则将当前的第一空间大小作为第二初值,将本轮寄存器数量作为第一寄存器数量,执行步骤5;步骤5、令第一空间大小为第二初值,设置第二步长的取值小于第一步长,令本轮寄存器数量的取值为0,令上轮寄存器数量的取值为第一寄存器数量;步骤6、编译第一核函数得到二进制代码,再对该二进制代码进行反编译得到待分析代码,记录待分析代码中寄存器的数量作为本轮寄存器数量;步骤7、若本轮寄存器数量与上轮寄存器数量之差的绝对值不小于第二阈值,则以本轮寄存器数量更新上轮寄存器数量,再令第一空间大小自加第二步长后执行步骤6;否则将当前的第一空间大小作为第三初值,将本轮寄存器数量作为第二寄存器数量,执行步骤8;步骤8、构建用于建立N个局部变量及共享存储器的第二核函数,将该共享存储器的空间大小记为第二空间大小,各局部变量的取值由共享存储器中的数据改变,其中,N为第二寄存器数量,令第二空间大小为第三初值,编译并执行第二核函数,记录执行时间,将该执行时间记为上轮执行时间;令本轮执行时间的取值为0;步骤9、编译并执行第二核函数,记录执行时间,以该执行时间更新本轮执行时间;步骤10、若本轮执行时间与上轮执行时间之差的绝对值小于第三阈值,则以本轮执行时间更新上轮执行时间,再令第二空间大小自减第二步长后执行步骤9;否则当前的第二空间大小即为GPU计算单元可用的共享存储器的空间大小,结束本流程。

全文数据:

权利要求:

百度查询: 北京麟卓信息科技有限公司 基于寄存器度量的GPU计算单元共享存储器大小测算方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。