买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】支持嵌入式平台多核并行的CNN网络推理框架设计方法_中国电子科技集团公司第十四研究所_202110647708.6 

申请/专利权人:中国电子科技集团公司第十四研究所

申请日:2021-06-10

公开(公告)日:2024-04-26

公开(公告)号:CN113298259B

主分类号:G06N5/04

分类号:G06N5/04;G06N3/0464;G06F15/78;G06N3/048

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2021.09.10#实质审查的生效;2021.08.24#公开

摘要:本发明属于雷达信息处理技术领域,公开了一种支持嵌入式平台多核并行的CNN网络推理框架设计方法。本发明的方法包括读取深度学习框架训练后模型文件,从中提取权值和偏置参数并用指针变量定义;将CNN网络中运算分别封装成运算核函数,进行通用编程接口设计,用于搭建CNN网络推理框架的预测函数;基于多核处理器的多线程机制,将预测函数绑定到多核处理器的核号;根据要部署CNN网络推理框架的平台类型,编写相应的VSIPL静态库;将CNN网络推理框架部署在各操作系统。采用本发明在嵌入式平台建立神经网络模型的推理框架,满足应用场景的实时处理需求,该推理框架支持多种芯片,兼容多种操作系统。

主权项:1.一种支持嵌入式平台多核并行的CNN网络推理框架设计方法,其特征在于,包括:CNN网络模型加载:读取深度学习框架训练后模型文件,从中提取权值和偏置参数,输出用指针变量定义的模型权值和偏置参数;所述训练后模型文件是包含模型参数的二进制文件,由控制表头参数+数据组成;其中,所述控制表头参数是整数,控制表头参数的第1个字是神经网络层数,第2、3、4个字表示第一层神经网络模型的权值矩阵维度,第5、6、7个字是第一层池化的维度,第8个字是第一层池化偏置的维度,第9、10、11个字是第二层池化的维度,第12个字是第二层池化偏置的维度;以此类推,直到最后一层神经网络;所述数据是根据控制表头参数的值,依次将第一层直到最后一层神经网络模型的权值和偏置数据存储在二进制文件中的数据;CNN网络函数封装:采用向量指令集、汇编语言和C语言将CNN网络中卷积运算、池化运算、激活运算和全连接运算分别封装成运算核函数,所述各运算核函数的输入是所述用指针变量定义的模型权值和偏置,输出分别是卷积层函数、池化层函数、激活函数、全连接层函数;基于VSIPL标准的基本块和视图对象设计,将封装的卷积层函数、池化层函数、激活函数、全连接层函数,包括函数参数,进行编程接口设计,统一成具有通用神经网络编程接口的运算核函数;采用所述具有通用神经网络编程接口的运算核函数搭建CNN网络推理框架的预测函数;进行自动化并行化设计:基于多核处理器的多线程机制,将所述CNN网络推理框架的预测函数作为线程函数,创建多个任务或多个线程,设计线程同步与通信,基于负载均衡原则对输入的测试数据集进行数据划分,通过线程绑定函数把各任务或线程绑定到多核处理器的核号;进行跨平台设计:根据要部署CNN网络推理框架的平台类型,编写相应的VSIPL静态库;将CNN网络推理框架部署在VxWorks、Linux、Windows、SylixOS或Reworks操作系统。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第十四研究所 支持嵌入式平台多核并行的CNN网络推理框架设计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。