【发明授权】一种用于神经网络模型推理跨平台的部署方法及架构_杭州海康威视数字技术股份有限公司_202011095515.6

申请/专利权人：杭州海康威视数字技术股份有限公司

申请日：2020-10-14

公开（公告）日：2024-06-21

公开（公告）号：CN112101529B

主分类号：G06N5/04

分类号：G06N5/04;G06N3/0464;G06N3/06

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2021.01.05#实质审查的生效;2020.12.18#公开

摘要：本发明公开了一种用于神经网络模型推理跨平台的部署方法及架构，本发明实施例提供的部署方法中，首先对数据进行统一处理；然后基于所加载的神经网络模型，确定神经网络模型推理，将统一处理后的数据输入到所述神经网络模型推理中；再次，根据神经网络模型推理，调用神经网络模型推理中的适用于平台的至少一个算子后，执行；最后，输出得到神经网络模型推理的解析结果。因此，本发明实施例在平台部署神经网络模型推理时，对神经网络模型推理进行了算子碎片化处理，而并不是直接将完整的神经网络模型推理进行部署，由于针对不同平台的神经网络模型推理中的相同算子可以被灵活使用，甚至是复用，所以实现了跨异构平台部署神经网络模型推理。

主权项：1.一种用于神经网络模型推理跨平台的部署方法，其特征在于，所述平台为不同异构平台所属芯片支持的平台，所述方法包括：获取神经网络模型推理，进行编译，部署到一平台上，其中，所述编译环境包括跨平台的编译环境及所述平台加载的异构平台所属芯片的硬件环境，依赖所述跨平台的编译环境实现跨平台的所述神经网络模型推理的编译，所述平台加载的异构平台所属芯片的硬件环境实现所述神经网络模型及所述神经网络模型封装接口的编译；所述平台加载的异构平台所属芯片封装统一处理的神经网络模型；其中，异构平台所属芯片对神经网络模型推理进行编译包括：获得多平台的获取神经网络模型推理；将多平台的获取神经网络模型推理进行编译，生成可执行文件；获得多平台的神经网络模型及模型封装接口；将多平台的神经网络模型及模型封装接口封装到异构平台所属芯片上，将生成的可执行文件加载到异构平台所属芯片上；对数据进行统一处理；基于所加载的神经网络模型，确定神经网络模型推理，将统一处理后的数据输入到所述神经网络模型推理中；根据神经网络模型推理，调用神经网络模型推理中的适用于平台的至少一个算子后，执行；输出得到神经网络模型推理的解析结果；所述根据神经网络模型推理，调用神经网络模型推理中的适用于平台的对应算子包括：识别神经网络模型推理中包括至少一个推理节点，每个推理节点具有一个待处理算子；针对每一个待处理算子，访问设置的算子库，通过公共接口从所述算子库中调用待处理算子对应的，适用于平台的算子执行，实现任务中的主要功能部分后，在平台的应用层完成任务中的简单功能部分；在所述访问设置的算子库，通过公共接口从所述算子库中调用待处理算子对应的，适用于平台的算子执行之前，还包括：对于不同平台的神经网络模型推理，需要至少一个算子中大部分是各个平台通用的，小部分是各个平台不通用的，将各个平台通用的作为平台通用子算子，将各个平台不通用的作为平台适配算子；获取待处理算子对应的，适用于平台的算子中的平台通用子算子；设置待处理算子对应的，适用于平台的算子中的平台适配子算子；将所获取的平台通用子算子与平台适配子算子结合，形成待处理算子对应的，适用于平台的算子；将待处理算子对应的，适用于平台的算子存储到设置的算子库中。

全文数据：

权利要求：

百度查询：杭州海康威视数字技术股份有限公司一种用于神经网络模型推理跨平台的部署方法及架构

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：延时调节方法及装置、电子设备_北京小米移动软件有限公司_202211643851.9

下一篇：空调器的控制方法与空调器_青岛海尔空调器有限总公司_202211643481.9

相关技术

延时调节方法及装置、电子设备_北京小米移动软件有限公司_202211643851.9

空调器的控制方法与空调器_青岛海尔空调器有限总公司_202211643481.9

无线通信方法及系统_杭州九阳小家电有限公司_202211640089.9

用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

一种悬索桥用超硬复合板及其制备工艺_德阳天元重工股份有限公司_202410240910.0

数据处理方法、装置、电子设备及存储介质_小红书科技有限公司_202311645889.4

一种内置旋转式堰门一体化分流井_高邮市恒立液压成套设备有限公司_202211640138.9

一种油溶性石墨烯的制备方法_重庆烯达科技有限公司_202410279749.8

一种降低彩虹纹的光栅波导装置以及波导系统_北京至格科技有限公司_202410658035.8

光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

一种模拟母乳油脂组合物及其制备方法与应用_杭州岛屿星晴生物技术有限公司_202410349373.3

设备的设计图生成方法和计算设备_超聚变数字技术有限公司_202410269408.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种用于神经网络模型推理跨平台的部署方法及架构_杭州海康威视数字技术股份有限公司_202011095515.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务