首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种大模型训练场景的高性能网络优化方法及系统 

申请/专利权人:北京蓝耘科技股份有限公司

申请日:2024-04-10

公开(公告)日:2024-06-28

公开(公告)号:CN118015434B

主分类号:G06V10/94

分类号:G06V10/94;G06V10/774;G06V10/764

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本发明涉及高性能数据处理技术领域,具体公开了一种大模型训练场景的高性能网络优化方法及系统,所述方法包括在计算任务中进行数据采样,构建测试集;遍历所述测试集,计算测试集中每一数据的处理复杂度,根据所述处理复杂度对测试集中的数据进行分类;根据每一类数据的数据占比以及每一类数据的处理复杂度随机确定N种进程分配数组;接收工作人员上传的目标时长,基于目标时长对N种进程分配数组进行评价,根据评价结果对N种进程分配数组进行M次迭代,确定最终进程分配数组。本发明技术方案对不同的图像集采用不同的处理方式,适应性强,测试速度快,只需要经过预设次数的迭代,即可得到较优解。

主权项:1.一种大模型训练场景的高性能网络优化方法,其特征在于,所述方法应用于图像处理领域,所述方法包括:接收计算任务,获取计算任务的数据区间;其中,计算任务为图像集;在数据区间中随机选取数据,插入始状态为空的测试集;将选取到的数据与已选取的数据进行比对,记录匹配的数据的数量;根据匹配的数据的数量确定递减区间,在数据区间中剔除递减区间;循环执行直至保留的数据区间的区间总长小于预设的长度阈值,输出测试集;遍历所述测试集,计算测试集中每一数据的处理复杂度,根据所述处理复杂度对测试集中的数据进行分类;根据每一类数据的数据占比以及每一类数据的处理复杂度随机确定N种进程分配数组;所述进程分配数组中的元素为每一类数据的进程占比;基于进程分配数组对测试集中的数据进行处理,同步记录运行时长;接收工作人员上传的目标时长,基于目标时长对运行时长进行评价,根据评价结果对N种进程分配数组进行M次迭代,确定最终进程分配数组。

全文数据:

权利要求:

百度查询: 北京蓝耘科技股份有限公司 一种大模型训练场景的高性能网络优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。