首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

加速深度学习推断的软硬件协同设计 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:百度(美国)有限责任公司

摘要:实施方式公开了加速深度学习推断的软硬件协同设计,包括一种人工智能芯片和应用于该人工智能芯片的卷积神经网络,该人工智能芯片包括处理器、至少一个并行计算单元和池化计算单元。该方法包括:将卷积任务划分成多个卷积子任务和相应的池化子任务;在不同的并行计算单元中执行卷积子任务,并在同一并行计算单元中执行卷积、批量归一化和非线性计算操作;将每个并行计算单元执行卷积子任务的执行结果发送给池化计算单元,以执行相应的池化子任务;合并池化计算单元对相应的卷积子任务输出的执行结果执行池化操作的执行结果,得到卷积任务的执行结果。这能减少数据传输,使得卷积神经网络的操作可以在边缘设备中以更低的功耗和更少的时间来完成。

主权项:1.一种应用于人工智能芯片的卷积神经网络计算方法,其中,所述人工智能芯片包括处理器、至少一个并行计算单元和池化计算单元,所述方法包括:由所述处理器将卷积任务划分为至少一个卷积子任务和至少一个对应的池化子任务,并确定对应于每个卷积子任务的并行计算单元,其中,所述卷积任务被配置为对所述卷积任务的待处理数据执行卷积、批量归一化、非线性计算和池化操作,所述卷积子任务被配置为对所述卷积子任务的待处理数据执行所述卷积任务中的卷积、批量归一化和非线性计算操作,并且所述池化子任务被配置为对所述对应的卷积子任务的执行结果执行所述卷积任务中的池化操作;由所述处理器将每个划分后的卷积子任务发送给对应于所述卷积子任务的所述并行计算单元,并且控制所述并行计算单元执行接收的卷积子任务;由相应的并行计算单元执行所述接收的卷积子任务,并且将执行结果作为待池化数据发送给所述池化计算单元;响应于接收到所述并行计算单元发送的指示信息,由所述处理器将目标池化子任务的池化参数发送给所述池化计算单元,所述指示信息指示所述卷积子任务已经完全执行,并且控制所述池化计算单元执行所述目标池化子任务,其中,所述目标池化子任务是指对应于发送了接收到的指示信息的所述并行计算单元的所述卷积子任务所对应的池化子任务;由所述池化计算单元执行相应的池化子任务;并将执行结果发送给所述处理器;以及由所述处理器合并从所述池化计算单元接收的相应的池化子任务的执行结果,以获得所述卷积任务的执行结果。

全文数据:

权利要求:

百度查询: 百度(美国)有限责任公司 加速深度学习推断的软硬件协同设计

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术