Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜青岛国实科技集团有限公司丛明明获国家专利权

恭喜青岛国实科技集团有限公司丛明明获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜青岛国实科技集团有限公司申请的专利基于神威处理器的算子融合方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119759583B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510244893.2,技术领域涉及:G06F9/50;该发明授权基于神威处理器的算子融合方法是由丛明明;陈溟;苏亮;马猛飞;贾晓艺;信子君设计研发完成,并于2025-03-04向国家知识产权局提交的专利申请。

基于神威处理器的算子融合方法在说明书摘要公布了:本发明涉及一种基于神威处理器的算子融合方法,属于算子融合技术领域,包括获取深度学习模型中计算图的算子,分析算子的数据访问模式,根据预设融合判定机制确定符合融合条件的待融合算子,并获取待融合算子的特征图,特征图利用待融合算子进行数据处理,将待融合算子的参数预先加载至神威处理器的局部数据存储器中,判断特征图的总数据流与局部数据存储器的容量的大小,通过判断结果对特征图的数据块进行划分,利用数据块完成待融合算子的运算,并输出运算后的数据块,减少了数据在处理器和外部存储器之间的频繁传输,能够充分利用神威处理器的计算资源,提升并行计算效率,优化内存访问模式,减少内存带宽的瓶颈。

本发明授权基于神威处理器的算子融合方法在权利要求书中公布了:1.一种基于神威处理器的算子融合方法,其特征在于,包括如下步骤:数据获取步骤:获取深度学习模型中计算图的算子,分析算子的数据访问模式,根据预设融合判定机制确定符合融合条件的待融合算子,并获取所述待融合算子的特征图;数据加载步骤:所述特征图利用所述待融合算子进行数据处理,其中,将所述待融合算子的参数预先加载至神威处理器的局部数据存储器中;数据运算步骤:判断所述特征图的总数据流与所述局部数据存储器的容量的大小,通过判断结果对所述特征图的数据块进行划分,利用所述数据块完成待融合算子的运算,并输出运算后的数据块;其中,判断所述特征图的总数据流与所述局部数据存储器的容量的大小的过程具体为:若所述特征图的总数据流超出所述局部数据存储器的容量,则通过动态计算最优分块大小,根据计算得到的最优分块采用分块流水线方式利用多个数据块依次完成待融合算子的运算,并输出运算后的数据块;否则,将所述特征图中的数据块连续加载至局部数据存储器中完成待融合算子的计算,并输出运算后的数据块;其中,所述数据加载步骤具体包括:根据所述神威处理器的架构模式判断数据访问模式,根据数据访问模式选择将所述待融合算子的参数加载至所述局部数据存储器中的方式,其中,当所述数据访问模式为连续访问时,根据所述神威处理器的接口向DMA控制器发送DMA请求,所述DMA控制器根据所述DMA请求将所述特征图中的数据块连续加载至局部数据存储器中;当所述数据访问模式为跨步访问时,在主存储器中将特征图的数据块进行重排,将离散的数据组成连续的数据块后,通过向所述DMA控制器发送DMA请求将所述数据块连续加载至局部数据存储器中;当所述数据访问模式为随机访问时,通过分析识别出数据块中访问次数超过预设次数的数据后,通过将所述数据移动至相邻位置以组成连续的数据块,再通过向所述DMA控制器发送DMA请求将所述数据块连续加载至局部数据存储器中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛国实科技集团有限公司,其通讯地址为:266000 山东省青岛市即墨市凤凰路以西、创业路以南;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。