首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种资源分配方法及GPU资源池调度系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广西机电职业技术学院

摘要:本发明公开了一种资源分配方法及GPU资源池调度系统,涉及GPU处理技术领域,为了解决GPU资源分配效率过低、传输效率过慢以及资源池资源池数据模型计算准确率降低的问题。本资源分配方法及GPU资源池调度系统,通过负载分配法、静态分配法、动态分配法、共享分配法、优先级分配法和预测分配法可以提高数据分配的完整性,将传输信道的信道参数进行确认能够有效的提高分配任务数据传输的匹配度,进而提高分配任务数据传输的效率和数据传输的稳定性,将数据进行标准统一化以避免因数据量纲不同而导致的模型训练不均和预测偏差,可以通过监控损失函数的变化和准确率等指标,调整模型参数和优化算法,以提高模型性能。

主权项:1.一种资源分配方法,其特征在于,包括如下步骤:S1:将GPU硬件特征进行确认,其中,GPU硬件特征包括:GPU硬件计算能力、核心构架、内存带宽和高吞吐量;S2:将不同的资源应用和资源场景进行确认,根据资源应用和资源场景中的GPU硬件特征确定任务分配的方法,其中,确认分配方法时将任务从资源池中进行AI计算调度;S3:分配方法确定后对分配任务进行大小计算,根据分配任务的大小选择对应的传输信道,将分配任务信号传输至设备中进行执行;针对S3中分配任务大小的计算,包括:分配任务从资源池中调取后,将每个分配任务进行确认;将分配任务数据进行数据格式统一,分配任务数据格式统一后将分配任务数据进行段落划分;其中,段落划分是将分配任务数据划分为多个长度相等的段落数据;根据分配任务数据的段落数量计算出该分配任务数据的数据长度;将分配任务数据的数据长度转换为数据存量数据,其中,存量数据为分配任务数据的数据大小;针对S3中分配任务的传输信道,包括:分配任务数据传输至每个设备中执行时,每个设备的传输信道均设置多条,其中,传输信道的数量不少于三条;将每条传输信道的信道参数进行确认,其中,信道参数为信道饱和度和信道剩余容量;并且,当传输信道每进行一次数据传输时,都会将传输信道的信道参数进行刷新;分配任务数据传输至每个设备中执行时,每个设备的传输信道均设置多条,包括:提取分配任务数据的数据量;提取单位时间内允许向所述设备进行数据传输的最大传输数据量;利用所述分配任务数据的数据量和单位时间内允许向所述设备进行数据传输的最大传输数据量设置所述设备对应的第一传输信道数量系数;其中,所述设备对应的第一传输信道数量系数通过如下公式获取: 其中,λ01表示第一传输信道数量系数;Cf表示分配任务数据的数据量;Cmax表示单位时间内允许向所述设备进行数据传输的最大传输数据量;Czmax表示分配任务数据中的单独段落对应出现的最大数据量;提取单位时间内向所述设备进行数据传输的数据发送端设备的设备数量;利用所述分配任务数据的数据量和单位时间内向所述设备进行数据传输的数据发送端设备的设备数量设置第二传输信道数量系数;其中,所述设备对应的第二传输信道数量系数通过如下公式获取: 其中,λ02表示第二传输信道数量系数;Cf表示分配任务数据的数据量;Cmax表示单位时间内允许向所述设备进行数据传输的最大传输数据量;n表示单位时间内向所述设备进行数据传输的数据发送端设备的设备数量;Ci表示第i个向所述设备进行数据传输的数据发送端设备单位时间向所述设备发送的平均数据量;利用所述设备对应的第一传输信道数量系数和第二传输信道数量系数结合所述分配任务数据获取所述设备对应的传输信道数量。

全文数据:

权利要求:

百度查询: 广西机电职业技术学院 一种资源分配方法及GPU资源池调度系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。