深度学习算力虚拟化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：上海熠知电子科技有限公司

摘要：本发明提供了一种深度学习算力虚拟化方法，包括：深度学习虚拟化平台统计业务请求到达的形态和规律，根据业务请求到达的形态和规律，智能预控制整个深度学习服务器集群的状态、以及预设置整个深度学习服务器集群的参数，以应付对该业务请求的形态和规律的预测；以及深度学习虚拟化平台将业务请求下发至深度学习服务器时，进一步明确处理延时的要求和吞吐率的要求。

主权项：1.一种深度学习算力虚拟化方法，其特征在于，包括：深度学习虚拟化平台统计业务请求到达的形态和规律，根据业务请求到达的形态和规律，智能预控制整个深度学习服务器集群的状态、以及预设置整个深度学习服务器集群的参数，以应付对该业务请求的形态和规律的预测；以及深度学习虚拟化平台将业务请求下发至深度学习服务器时，进一步明确处理延时的要求和吞吐率的要求，其中所述业务请求到达的形态和规律包括：单流类业务请求，其业务请求以流的形式到达，且单次到达的样本数为1；多流类业务请求，其业务请求以流的形式到达，且单次到达多个样本；服务器类业务请求，业务请求随机到达；以及离线类业务请求，其所有业务请求和样本数据均批量到达；各类业务请求对运算完成时限的敏感度排序为：单流类业务请求和多流类业务请求大于服务器类业务请求，服务器类业务请求大于离线类业务请求，在单流类业务请求和多流类业务请求的应用场景下，深度学习虚拟化平台根据预先的业务设定情况，使得各深度学习服务器的调度按照既定策略进行静态分配，定期跟踪业务设定情况的变化；预先的业务设定情况包括：各业务请求到达的间隔时间，预期需要完成业务请求的时限要求，单次到达的样本数量，以及需加载的模型实例种类；所述既定策略包括：根据业务设定情况，一次性将所需的计算资源静态分配给各业务请求使用，并定时跟踪计算资源的耗用情况及运算完成的时限情况，如果出现业务未按照规律抵达或计算资源耗用异常，则作为故障上报，在服务器类业务请求的应用场景下，实时统计业务到达的具体情况、以及待处理任务的队列长度，得到业务到达规律的统计结果；根据对业务到达规律的统计结果在底层计算硬件上采用动态方式加载模型实例，以加强并行处理能力，减少队列等候时间，以最经济的方式分配计算资源，同时使已分配的计算资源利用率最大化；当针对某模型实例的计算请求等候队列的任务数量大于第一阈值且持续时间超出第二阈值，则从底层计算硬件上多加载1个模型实例，若任务数量持续大于第一阈值，则继续加载模型实例，直至恢复到正常业务吞吐水平；当针对某模型实例的计算请求等候队列的任务数量小于第三阈值且持续时间超出第四阈值，则从底层计算硬件上释放1个模型实例，若任务数量持续小于第三阈值，则逐步减少模型实例，直至在正常业务吞吐水平下计算资源利用率达到预设水平，在离线类业务请求的应用场景下，若预期的处理时间通过人为预订，则根据预期的处理时间和此刻计算资源的可用程度，一次性并行加载指定数量的模型实例，同时结合批加快运算处理，其中深度学习虚拟化平台将虚拟化的所有资源进行汇总，根据汇总的资源将业务请求分配至深度学习服务器；以及深度学习服务器通过本地算力聚合及任务分配系统将任务分配至其内部的各个深度学习单元，以使各个深度学习单元能够处理任务；其中各个深度学习单元的算力被聚合在本地算力聚合及任务分配系统中，其中所述本地算力聚合及任务分配系统包括：本地模型池，被配置为对接深度学习虚拟化平台的总模型池；运算任务请求接口，被配置为与深度学习虚拟化平台对接任务和处理结果；模型管理器，被配置为在底层计算硬件上加载模型实例；任务调度器，被配置为将运算任务送往底层计算硬件上的模型实例进行计算，以及将运算任务拼成批以提高效率；以及状态采集器，被配置为采集本深度学习服务器的算力总资源、当前算力占用比例、任务处理速度、队列种类及队列等待长度，上报深度学习虚拟化平台。

全文数据：

权利要求：

百度查询：上海熠知电子科技有限公司深度学习算力虚拟化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种施工用线缆安装调节架

下一篇：一种船舶油泵拆装机构

相关技术

一种施工用线缆安装调节架

一种船舶油泵拆装机构

圆柱形产品等离子表面处理机

一种便于豆腐乳毛霉清洗装置

一种主动切纸装置

一种润滑油添加剂上料装置

一种柔性硅胶底托线条灯

一种用于topcon湿法工序链式机上料自动旋转的装置

一种用于浅覆盖层的无底钢混组合围堰

一种金刚石微粉大颗粒检测装置

一种包芯线过油设备

电动叉车驱动轮总成

学习相关技术

儿童可升降学习椅_上海道索国际贸易有限公司_202420336292.5

自动行驶装置、学习装置、自动行驶装置的控制方法以及学习方法_三菱电机楼宇解决方案株式会社_202280093237.1

多智能体学习方法_三菱电机株式会社_202280093209.X

大规模分层强化学习_渊慧科技有限公司_202380026286.8

深度学习算力虚拟化方法_上海熠知电子科技有限公司_202110962785.0

基于深度学习模型的推理方法_伟光有限公司_202310457947.4

一种基于深度学习和知识追踪的自适应学习环境生成方法_天津大学合肥创新发展研究院_202411173686.4

基于集成学习和增量学习的无线电信号调制类型识别方法_北京计算机技术及应用研究所_202410847501.7

一种音乐智能学习方法_北京艺旗网络科技有限公司_202111010873.7

基于深度学习的图像处理方法、装置及系统_青岛特来电大数据有限公司_202411026733.2

算相关技术

算力路由方法、装置及介质_中国联合网络通信集团有限公司_202410822180.5

深度学习算力虚拟化方法_上海熠知电子科技有限公司_202110962785.0

算网业务处理方法及相关设备_中国电信股份有限公司_202411322442.8

一种智算中心光模块测试方法_中国信息通信研究院_202410990510.1

一种算力调度方法、系统、装置、产品及存储介质_浪潮(北京)电子信息产业有限公司_202411010568.1

算力信息同步方法、装置、设备、存储介质和产品_中国移动通信有限公司研究院_202411017806.1

一种基于算力的数据自动迁移系统及方法_重庆博拉智算科技有限公司_202410960033.4

一种基于隐私保护机器学习的区块链算力回收共识方法_华东师范大学_202410867305.6

一种用于解算PPP-RTK定位服务完好性信息的方法_中国电子科技集团公司第五十四研究所_202411201078.X

一种智能计算中心的算力资源访问方法及装置_北京九章云极科技有限公司_202411319777.4

虚拟化相关技术

基于可扩展遗传算法的虚拟化系统的虚拟网络功能的联合放置和链接_瑞典爱立信有限公司_201980050947.4

虚拟眼镜_北京新唐思创教育科技有限公司_202322629746.6

虚拟化系统监测能力的控制方法、装置和设备_奇安信科技集团股份有限公司_202410917937.9

基于态势及需求混合驱动的天基资源能力虚拟化方法和系统_中国科学院国家空间科学中心_202410483435.X

一种工业互联网设备虚拟化诱骗平台_哈尔滨工程大学_202211669950.4

一种云端虚拟化GPU的管理方法、系统及相关装置_北京浪潮数据技术有限公司_202011403158.5

虚拟现实设备_广东聚华新型显示研究院_202323667292.8

安卓系统显示器的虚拟映射方法、装置和虚拟映射系统_深圳市一恒科电子科技有限公司_202311784289.6

基于虚拟标签的烟叶分级和追踪溯源系统_广东力生智能有限公司_202411321107.6

基于虚拟数据和真实数据的机器学习_达索系统美国公司_202010329355.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

深度学习算力虚拟化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务