首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

应用于分布式集群的模型训练方法、装置 

申请/专利权人:北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司

申请日:2022-12-28

公开(公告)日:2024-06-28

公开(公告)号:CN118261773A

主分类号:G06T1/20

分类号:G06T1/20;G06F13/42;G06F18/214;G06F9/46;G06N3/04;G06N3/08

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本公开的实施例公开了应用于分布式集群的模型训练方法、装置。该方法的一具体实施方式包括:对自然语言处理模型对应的训练样本集进行拆分,得到多个训练样本子集;将多个训练样本子集中的每个训练样本子集分配至分布式集群中的一个计算节点序列,计算节点序列上部署有自然语言处理模型,自然语言处理模型包括多个子网络,计算节点序列中的每个计算节点上部署有多个子网络中的一个子网络;对于计算节点序列中的计算节点,将对应的子网络的参数集进行拆分,得到多个参数子集;将多个参数子集中每个参数子集分配至计算节点中的一个计算单元,以对自然语言处理模型进行训练。该实施方式与人工智能有关,提升了分布式集群的模型训练效率。

主权项:1.一种应用于分布式集群的模型训练方法,所述分布式集群中的计算节点包括中央处理器和多个图形处理器,不同的计算节点的图形处理器之间直接通信,同一计算节点的不同图形处理器之间通过总线通信,包括:对自然语言处理模型对应的训练样本集进行拆分,得到多个训练样本子集;将所述多个训练样本子集中的每个训练样本子集分配至所述分布式集群中的一个计算节点序列,所述计算节点序列上部署有所述自然语言处理模型,所述自然语言处理模型包括多个子网络,所述计算节点序列中的每个计算节点上部署有所述多个子网络中的一个子网络,所述每个计算节点包括多个计算单元;对于所述计算节点序列中的计算节点,将对应的子网络的参数集进行拆分,得到多个参数子集;将所述多个参数子集中每个参数子集分配至所述计算节点中的一个计算单元,以对所述自然语言处理模型进行训练。

全文数据:

权利要求:

百度查询: 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 应用于分布式集群的模型训练方法、装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。