首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种边云协同下DNN推理加速方法_重庆大学_202410175179.8 

申请/专利权人:重庆大学

申请日:2024-02-07

公开(公告)日:2024-06-21

公开(公告)号:CN118228782A

主分类号:G06N3/0495

分类号:G06N3/0495;G06N3/092;G06N5/04

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:一种边云协同下DNN推理加速方法,包括以下步骤:1获取边缘设备的资源信息、云服务器的资源信息以及预训练的DNN模型信息;2设定分区点,并基于所述分区点将预训练的DNN模型信息划分为两个部分,分别记为第一DNN子模型、第二DNN子模型;3计算第一DNN子模型各层的压缩率,对第一DNN子模型进行压缩,得到第一DNN压缩模型;将第一DNN子模型、第二DNN子模型分别部署在边缘设备和云服务器上;4执行DNN模型推理。本发明综合考虑了推理中模型的准确性和推理过程中的延迟来优化模型划分和压缩的策略,在保证模型准确率的同时减少推理延迟。本发明可以满足DNN模型不同的准确率需求,以最小化延迟。

主权项:1.一种边云协同下DNN推理加速方法,其特征在于,包括以下步骤:1获取边缘设备的资源信息、云服务器的资源信息以及预训练的DNN模型信息;2设定分区点,并基于所述分区点将预训练的DNN模型信息划分为两个部分,分别记为第一DNN子模型、第二DNN子模型;3计算第一DNN子模型各层的压缩率,对第一DNN子模型进行压缩,得到第一DNN压缩模型;将第一DNN压缩模型、第二DNN子模型分别部署在边缘设备和云服务器上;4执行DNN模型推理。

全文数据:

权利要求:

百度查询: 重庆大学 一种边云协同下DNN推理加速方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。