首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于异构GPU的分布式训练系统、方法、装置、存储介质、电子设备及产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国建设银行股份有限公司;建信金融科技有限责任公司

摘要:本发明涉及人工智能与分布式计算技术领域。本发明公开了一种基于异构GPU的分布式训练系统、方法、装置、存储介质、电子设备及产品。其中系统包括:统筹模块用于获取待训练模型的模型结构,对模型结构进行分块处理得到多个模型块,将多个模型块分发至各GPU处理模块中;多个GPU处理模块同步执行对待训练模型的训练任务,统筹模块接收各GPU处理模块传输的每一模型块的模型更新参数,基于每一模型块的模型更新参数形成待训练模型的参数计算图。多种GPU类型的GPU处理模块为模型训练过程提供所需算力,支持大计算量的模型训练过程,实现基于异构GPU对AI模型的分布式训练,提高模型训练效率。

主权项:1.一种基于异构GPU的分布式训练系统,其特征在于,包括:统筹模块和多个GPU处理模块,不同的GPU处理模块对应不同GPU类型的GPU资源;所述统筹模块与多个GPU处理模块之间基于第一通信协议进行数据交互;所述统筹模块用于:获取待训练模型的模型结构,对所述模型结构进行分块处理,得到多个模型块,将所述多个模型块分发至各所述GPU处理模块中;多个所述GPU处理模块同步执行对待训练模型的训练任务,其中,每一所述GPU处理模块分别对分发的所述模型块进行训练处理过程,并在所述训练处理过程中将得到的计算数据与其他GPU处理模块通过所述第一通信协议进行数据交互,以及与所述统筹模块通过所述第一通信协议进行数据交互;其中,所述训练处理过程包括前向传播计算、反向传播计算和模型参数更新,所述计算数据包括前向计算数据、反向计算数据和模型更新参数的一项或多项;所述统筹模块基于各所述GPU处理模块传输的每一模型块的模型更新参数,形成所述待训练模型的参数计算图。

全文数据:

权利要求:

百度查询: 中国建设银行股份有限公司 建信金融科技有限责任公司 一种基于异构GPU的分布式训练系统、方法、装置、存储介质、电子设备及产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。