首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种用于神经网络的算子融合方法及相关装置_华为技术有限公司_202211584001.6 

申请/专利权人:华为技术有限公司

申请日:2022-12-09

公开(公告)日:2024-06-11

公开(公告)号:CN118171683A

主分类号:G06N3/04

分类号:G06N3/04;G06N3/0464;G06N3/08;G06F18/25

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.28#实质审查的生效;2024.06.11#公开

摘要:本申请实施例提供一种用于神经网络的算子融合方法及相关装置。该方法中,获取神经网络模型,确定该神经网络模型对应的计算图。计算图可以描述该神经网络模型中的多个算子之间的连接关系,每个算子可以执行一个计算操作。为了提高融合效率,确定计算图中的至少两个待融合子图。在第一待融合子图包括至少两个算子且第一待融合子图在设定芯片上运行所需的资源量的利用率大于利用率阈值时,将该第一待融合子图包括的至少两个算子融合为一个算子。而第一待融合子图所需的利用率与设定芯片的内存大小以及第一待融合子图包括的计算操作的总数量相关的,考虑了芯片的内存大小,使得融合算子能够充分利用芯片的资源,进而提升神经网络模型的运算速度。

主权项:1.一种用于神经网络的算子融合方法,其特征在于,包括:获取神经网络模型,并确定所述神经网络模型对应的计算图,所述计算图用于描述所述神经网络模型中的多个算子之间的连接关系;所述多个算子中每个算子用于执行至少一个计算操作;确定所述计算图中的至少两个待融合子图,所述至少两个待融合子图中任一待融合子图包括至少一个算子;在第一待融合子图满足融合条件时,将所述第一待融合子图包括的至少两个算子融合为一个算子;所述第一待融合子图为所述至少两个待融合子图中的任一个;所述融合条件包括:所述第一待融合子图包括至少两个算子,且所述第一待融合子图在设定芯片上运行所需的资源量的利用率大于利用率阈值,所述第一待融合子图在设定芯片上运行所需的资源量的利用率与所述设定芯片的内存大小以及所述第一待融合子图中至少两个算子所包括的计算操作的总数量相关。

全文数据:

权利要求:

百度查询: 华为技术有限公司 一种用于神经网络的算子融合方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。