恭喜中国科学院计算机网络信息中心赵海杉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国科学院计算机网络信息中心申请的专利张量处理单元上加速稀疏矩阵计算的方法及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119441698B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411531342.6,技术领域涉及:G06F17/16;该发明授权张量处理单元上加速稀疏矩阵计算的方法及存储介质是由赵海杉;李三;汪嘉恒;周纯葆;王珏;辛之夼;李顺德;梁智强;刘芳;王彦棡设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。
本张量处理单元上加速稀疏矩阵计算的方法及存储介质在说明书摘要公布了:本申请公开了一种张量处理单元上加速稀疏矩阵计算的方法及存储介质,所述方法包括:获取第一矩阵,其中第一矩阵包括行索引值或列索引值,第一矩阵为基于输入序列得到的稀疏矩阵;基于行索引值或列索引值,对所述第一矩阵的行和列进行重新排序,得到第二矩阵,以使所述第二矩阵相对于第一矩阵的缓存命中率更高;从GPU的内存中读取第三矩阵,并对所述第二矩阵和第三矩阵进行运算,其中所述第三矩阵是指与所述第二矩阵进行运算的矩阵,所述第三矩阵基于所述输入序列得到。通过本技术,并在tensorcore上执行矩阵运算,减少了冗余计算操作,提升了运行过程中的缓存命中率实现了对稀疏矩阵的高效计算与运算资源的优化利用,极大地提升了矩阵计算的整体性能。
本发明授权张量处理单元上加速稀疏矩阵计算的方法及存储介质在权利要求书中公布了:1.一种在张量处理单元上加速稀疏矩阵计算的方法,其特征在于,包括:获取第一矩阵,其中所述第一矩阵包括行索引值或列索引值,所述第一矩阵为基于输入序列得到的稀疏矩阵;基于所述行索引值或列索引值,对所述第一矩阵的行和列进行重新排序,得到第二矩阵,以使所述第二矩阵相对于第一矩阵的缓存命中率更高;从GPU的内存中读取第三矩阵,并对所述第二矩阵和第三矩阵进行运算,其中所述第三矩阵是指与所述第二矩阵进行运算的矩阵,所述第三矩阵基于所述输入序列得到;所述基于所述行索引值或列索引值,对所述第一矩阵的行和列进行重新排序,得到第二矩阵,包括:将所述第一矩阵的行索引值或列索引值作为节点,并对所述第一矩阵进行节点化分析,得到节点之间的连接关系以及节点的度,其中,所述度是指对应节点边的个数;基于所述节点之间的连接关系以及所述节点的度将所述第一矩阵的行和列进行重新排序,得到第二矩阵;所述从GPU的内存中读取第三矩阵,包括:进行预处理,在所述预处理之后进行以同步周期为最小单元的重复操作,直至,其中所述同步周期满足:在第x个同步周期内,加载第n-1个第三矩阵至寄存器内存;加载第n个矩阵块列索引至共享内存;加载第n-1个第二矩阵至共享内存,并计算第n-2个矩阵运算,其中第n-2个矩阵运算基于第n-2个第二矩阵和第n-2个第三矩阵得到,其中加载第n-1个第三矩阵基于在第x-2个同步周期内加载第n-1个矩阵列索引得到,x≥3,所述预处理用于为后续的同步周期提供计算数据;所述张量处理单元包括线程块,所述对所述第二矩阵和第三矩阵进行运算,包括:获取线程块处理原始任务的总处理时间;根据线程块的总处理时间,对原始任务进行重新分配,以使重新分配后的总处理时间的分布相对于所述原始任务的总处理时间更一致;其中,线程块的总处理时间T的计算方式为:T=tcm*lot+cot+rwm*wt,其中,tcm是所处理矩阵块数量,lot是预设的单次取数时间,cot是预设的单次计算时间,rwm是所处理矩阵块对应窗口的个数,wt是预设的单次写回时间。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算机网络信息中心,其通讯地址为:100190 北京市海淀区中关村南四街4号院内2号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。