首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于模型蒸馏的异构算力调度方法、系统及可读存储介质 

申请/专利权人:浙江鹏信信息科技股份有限公司

申请日:2024-04-29

公开(公告)日:2024-06-28

公开(公告)号:CN118093210B

主分类号:G06F9/50

分类号:G06F9/50;G06F21/57;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.06.14#实质审查的生效;2024.05.28#公开

摘要:本发明涉及基于模型蒸馏的异构算力调度方法、系统及可读存储介质,其调度方法包括以下步骤:S1、采集算力资源请求;其中,算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池;S2、基于目标资源池的算力大小,判断算力资源请求所需的算力大小是否满足目标要求;若否,则转至步骤S3;若是,则转至步骤S4;S3、基于知识蒸馏对预训练模型进行模型压缩,基于压缩后的模型分配对应的算力资源;S4、调度分配对应的算力资源并进行安全校验,安全校验通过后进行下发。本发明通过模型能力迁移的方式,选择轻量级模型以达到模型压缩的目的,以聚合社会多方算力、满足算力消费方多样化业务需求。

主权项:1.基于模型蒸馏的异构算力调度方法,其特征在于,包括以下步骤:S1、采集算力资源请求;其中,算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池;S2、基于目标资源池的算力大小,判断算力资源请求所需的算力大小是否满足目标要求;若否,则转至步骤S3;若是,则转至步骤S4;S3、基于知识蒸馏对预训练模型进行模型压缩,基于压缩后的模型分配对应的算力资源,并转至步骤S4;S4、调度分配对应的算力资源并进行安全校验,安全校验通过后进行下发;所述步骤S3中,模型压缩的过程包括以下步骤:S31、将预训练模型作为教师模型,选择轻量级网络模型作为学生模型;S32、基于训练样本训练教师模型,计算输出三层不同深度的注意力图谱,将其定义为梯度,结合梯度迁移的计算方式,使其迁移至学生模型进行迭代训练,输出学生模型蒸馏结果的软硬标签Soft-target、Hard-target,基于软硬标签在教师模型、学生模型上分别运用Softmax损失迭代的方式进行N次迭代,选择加权平均的计算方式得到损失函数和: 其中,表示第i次迭代的教师模型标签的概率分布,表示学生模型标签的概率分布,T为温度系数,avg为加权平均,表示输入的训练样本标签;损失函数基于T=1时计算得到;S33、定义综合损失函数;其中,,h∈[0,π2];S34、迭代输出最终的学生模型,实现教师模型的能力迁移到学生模型。

全文数据:

权利要求:

百度查询: 浙江鹏信信息科技股份有限公司 基于模型蒸馏的异构算力调度方法、系统及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。