买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京航空航天大学;南京南机智农农机科技研究院有限公司
摘要:本发明公开了一种基于ZYNQ的压缩YOLOv4‑Tiny网络加速器,涉及目标检测卷积神经网络的硬件加速领域,加速器包括PS端与PL端,以及负责两者之间通信的AXI总线。PS端包含参数配置及运行控制模块,拼接层Concat层计算模块,DDR、SD卡数据交互模块;PL端包含卷积激活模块,采样计算模块,卷积、采样输入输出缓存模块。卷积激活模块主要实现卷积运算与激活函数计算,采用BN层融合、卷积并行、激活函数优化、定点量化等手段来提高计算效率;采样计算模块采用流水线结构,提高采样计算速度;卷积、采样输入输出缓存模块用于存储卷积、采样的输入特征图数据、权重数据、输出特征图数据。另外,本发明能够进一步减小模型的前向推理时间。
主权项:1.一种基于ZYNQ的压缩YOLOv4-Tiny网络加速器,其特征在于,包括处理系统PS端以及与其数据通信的可编程逻辑PL端,PL端包括卷积激活模块、采样计算模块、卷积输入输出缓存模块和采样输入输出缓存模块;其中,PS端,用于存放从外部读取的输入特征图数据与权重数据,并将加速器IP核的开启信号与配置信息发送到PL端;PL端,接收到加速器IP核的开启信号与配置信息后,读取PS端中的权重数据与输入特征图数据,并进行卷积采样运算;其中,卷积输入输出缓存模块,用于存储网络模型中卷积层运算所需的输入特征图数据和权重数据,以及卷积层运算得到的输出特征图数据;卷积激活模块,用于从卷积输入输出缓存模块读取当前运算所需的输入特征图数据和权重数据,采用批归一化BN层融合、卷积并行、激活函数优化和定点量化加速方法,并行实现卷积运算与激活函数计算,并将计算结果保存至卷积输入输出缓存模块;采样输入输出缓存模块,用于存储网络模型中采样层计算所需的输入特征图数据,以及采样层计算得到的输出特征图数据;采样计算模块,从采样输入输出缓存模块读取当前运算所需的输入特征图数据,采用流水线结构进行采样计算,并将计算结果保存至采样输入输出缓存模块。
全文数据:
权利要求:
百度查询: 南京航空航天大学 南京南机智农农机科技研究院有限公司 一种基于ZYNQ的压缩YOLOv4-Tiny网络加速器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。