买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明公开了一种面向共享式GPU集群下的容器调度方法及装置,获取Pod创建请求,根据Pod创建请求中Pod创建信息对Pod进行校验获得Pod标记,并根据Pod创建信息获取Pod总的所需资源信息;根据Pod创建信息中Pod业务优先级标签和Pod总的所需资源信息对Pod进行排序,获得调度队列队头的待调度Pod;根据待调度Pod的Pod创建信息中Pod所需的CPU标签、内存标签与GPU标签,Pod标记和集群节点状态信息,对节点进行过滤,获得Pod可调度节点;根据Pod可调度节点的数量和待调度Pod的Pod标记,计算Pod对应可调度节点的得分,根据得分待调度Pod匹配最优的Pod可调度节点。本发明提高任务处理效率及节点内资源的利用率。既考虑负载均衡,又提高资源利用率,且避免出现CPU、内存消耗不均衡。
主权项:1.一种面向共享式GPU集群下的容器调度方法,其特征在于:包括如下步骤:获取Pod创建请求,根据Pod创建请求中Pod创建信息对Pod进行校验获得Pod标记,并根据Pod创建信息获取Pod总的所需资源信息;根据Pod创建信息中Pod业务优先级标签和Pod总的所需资源信息对Pod进行排序,获得调度队列队头的待调度Pod;根据待调度Pod的Pod创建信息中Pod所需的CPU标签、内存标签与GPU标签,Pod标记和集群节点状态信息,对节点进行过滤,获得Pod可调度节点;根据Pod可调度节点的数量和待调度Pod的Pod标记,计算Pod对应可调度节点的得分,根据得分待调度Pod匹配最优的Pod可调度节点;所述根据Pod可调度节点的数量和待调度Pod的Pod标记,计算Pod对应可调度节点的得分,根据得分待调度Pod匹配最优的Pod可调度节点,包括:当Pod可调度节点数量等于1,将该可调度节点作为最佳节点;当Pod可调度节点数量大于1,若待调度Pod的Pod标记为非需要GPU资源Pod,计算非需求GPU资源Pod对应可调度节点的得分Score1,选择得分最高节点作为最佳节点,并将待调度Pod与最佳节点进行绑定;非需求GPU资源Pod对应可调度节点的得分Score1计算公式如下:Score1=CpuMemoryScore1×CpuMemoryWeight1+GpuFreeScore×GpuFreeWeight其中,CpuMemoryWeight1为CPU、内存资源均衡第一得分的权重,GpuFreeWeight为GPU空闲率得分的权重,CpuMemoryScore1为CPU、内存资源均衡第一得分,GpuFreeScore为GPU空闲率得分;所述CpuMemoryScore1计算公式如下: 其中,RequestedCPUSum表示待调度Pod的CPU资源申请量,NodeFreeCpuSum表示可调度节点内剩余空闲CPU总量之和,RequestedMemorySum表示待调度Pod的内存资源申请量,NodeFreeMemorySum表示可调度节点内剩余空闲内存资源之和,abs*表示取绝对值;所述GpuFreeScore计算公式如下: 其中,NodeFreeGpuMemory表示可调度节点内剩余空闲GPU显存总量之和,NodeMaxGpuMemory表示可调度节点中所有GPU显存总量的最大值;当Pod可调度节点数量大于1,若待调度Pod的Pod标记为需要GPU资源Pod,计算需求GPU资源Pod对应可调度节点的得分Score2,选择得分最高节点作为最佳节点,并将待调度Pod与最佳节点进行绑定;需求GPU资源Pod对应可调度节点的得分Score2计算公式如下:Score2=GpuScore×GpuWeight+NodeGPUSocre×NodeGpuWeight+CpuMemoryScore2×CpuMemoryWeight2其中,GpuWeight为GPU得分的权重,NodeGpuWeight为Pod配额得分的权重,CpuMemoryWeight2为CPU、内存资源第二得分的权重,GpuScore为节点内GPU得分,NodeGPUSocre为Pod配额得分,CpuMemoryScore2为CPU、内存资源均衡第二得分;所述GpuScore计算公式如下: 其中,GpuScore表示为可调度节点中每个GPU得分之和,GpuDomain表示可调度节点GPU时钟频率,PerMaxGpuDomain表示可调度节点中满足待调度Pod请求的所有GPU中时钟频率最大值,GpuPower表示可调度节点GPU功率,PerMaxGpuPower表示可调度节点中满足待调度Pod请求的所有GPU中功率最大值,PerFreeGpuMemory表示可调度节点中每个GPU的空闲显存,NodeFreeGpuMemory表示可调度节点中所有空闲显存总量,TotalGpuMemory表示可调度节点GPU显存总量,NodeMaxGpuMemory表示可调度节点中满足待调度Pod请求的显存总量;所述NodeGPUSocre计算公式如下: 其中,PodGpuMemorySum表示为待调度PodGPU显存申请总量;所述CpuMemoryScore2计算公式如下: 其中,CpuMemoryScore2为CPU、内存资源均衡第二得分,cpu表示为可调度节点CPU空闲度,memory表示为可调度节点内存空闲度,NodeMaxCpuSum表示为可调度节点CPU资源最大容量,RequestedCPUSum表示为待调度Pod的CPU申请总量,NodeMaxMemorySum表示为可调度节点内存资源最大容量,RequestedMemorySum表示为待调度Pod的内存申请总量。
全文数据:
权利要求:
百度查询: 南京邮电大学 一种面向共享式GPU集群下的容器调度方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。