基于模型蒸馏的异构算力调度方法、系统及可读存储介质

导航：龙图腾网> 最新专利技术> 基于模型蒸馏的异构算力调度方法、系统及可读存储介质

申请/专利权人：浙江鹏信信息科技股份有限公司

申请日：2024-04-29

公开（公告）日：2024-06-28

公开（公告）号：CN118093210B

主分类号：G06F9/50

分类号：G06F9/50;G06F21/57;G06N20/00

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2024.06.14#实质审查的生效;2024.05.28#公开

摘要：本发明涉及基于模型蒸馏的异构算力调度方法、系统及可读存储介质，其调度方法包括以下步骤：S1、采集算力资源请求；其中，算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池；S2、基于目标资源池的算力大小，判断算力资源请求所需的算力大小是否满足目标要求；若否，则转至步骤S3；若是，则转至步骤S4；S3、基于知识蒸馏对预训练模型进行模型压缩，基于压缩后的模型分配对应的算力资源；S4、调度分配对应的算力资源并进行安全校验，安全校验通过后进行下发。本发明通过模型能力迁移的方式，选择轻量级模型以达到模型压缩的目的，以聚合社会多方算力、满足算力消费方多样化业务需求。

主权项：1.基于模型蒸馏的异构算力调度方法，其特征在于，包括以下步骤：S1、采集算力资源请求；其中，算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池；S2、基于目标资源池的算力大小，判断算力资源请求所需的算力大小是否满足目标要求；若否，则转至步骤S3；若是，则转至步骤S4；S3、基于知识蒸馏对预训练模型进行模型压缩，基于压缩后的模型分配对应的算力资源，并转至步骤S4；S4、调度分配对应的算力资源并进行安全校验，安全校验通过后进行下发；所述步骤S3中，模型压缩的过程包括以下步骤：S31、将预训练模型作为教师模型，选择轻量级网络模型作为学生模型；S32、基于训练样本训练教师模型，计算输出三层不同深度的注意力图谱，将其定义为梯度，结合梯度迁移的计算方式，使其迁移至学生模型进行迭代训练，输出学生模型蒸馏结果的软硬标签Soft-target、Hard-target，基于软硬标签在教师模型、学生模型上分别运用Softmax损失迭代的方式进行N次迭代，选择加权平均的计算方式得到损失函数和：其中，表示第i次迭代的教师模型标签的概率分布，表示学生模型标签的概率分布，T为温度系数，avg为加权平均，表示输入的训练样本标签；损失函数基于T=1时计算得到；S33、定义综合损失函数；其中，，h∈[0，π2]；S34、迭代输出最终的学生模型，实现教师模型的能力迁移到学生模型。

全文数据：

权利要求：

百度查询：浙江鹏信信息科技股份有限公司基于模型蒸馏的异构算力调度方法、系统及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种隐框式岩板蜂窝复合板

下一篇：一种茶叶生产用高效翻炒装置

相关技术

一种隐框式岩板蜂窝复合板

一种茶叶生产用高效翻炒装置

一种可移动式智能温控糖化槽生产线

一种配电网规划用的智慧配电网架

气动搬运平台

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

一种纸尿裤生产用包边机

一种预应力钢绞线辅助穿束防缠绕工具

一种新型全遮光窗帘面料

一种杀菌效果好的卤制品杀菌锅

混料搅拌装置

一种泡菜水检测用的取样装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于模型蒸馏的异构算力调度方法、系统及可读存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务