一种加速异构处理器池化运算的方法和系统

导航：龙图腾网> 最新专利技术> 一种加速异构处理器池化运算的方法和系统

申请/专利权人：湖南大学

申请日：2024-03-11

公开（公告）日：2024-06-28

公开（公告）号：CN118260070A

主分类号：G06F9/50

分类号：G06F9/50;G06N3/063;G06N3/0464

优先权：

专利状态码：在审-公开

法律状态：2024.06.28#公开

摘要：本发明公开了一种面向异构处理器的池化运算函数高性能实现方法，通过将特征图在空间维度进行分块，使用直接存储器访问DirectMemoryAccess，简称DMA控制数据在内存和高速缓存的传输，从而构建双缓冲机制使得访存延迟得以隐藏，同时依据向量运算资源数目和SIMD特性设计实现并行运算策略以充分利用运算资源，并在计算过程中进行数据重用，减少访存数量。

主权项：1.一种加速异构处理器池化运算的方法，其特征在于，包括以下步骤：1CPU获取用于池化操作计算的多个参数，根据获取的所有参数分配DSP存储空间并构造DSP函数参数，并通过thread接口设置DSP启动计算核心数量，并将DSP函数参数发送到DSP端；2DSP端依据其AM空间的大小和DSP函数参数中的输入数据的尺寸、输出数据的尺寸进行分块参数决策，以得到分块参数，包括输入子块尺寸和输出子块尺寸，根据分块参数中的输入子块尺寸和输出子块尺寸在AM空间中获取两组输入子块存储空间stream_in[0]、stream_in[1]和输出子块存储空间stream_out[0]、stream_out[1]，将输入数据的N维度和C维度进行合并，最终得到一个值为N*C的维度B，其编号是从0到B-1，并将输出数据的N维度和C维度进行合并，最终得到一个值为N*C的维度B，其编号是从0到B-1，根据DSP的计算核心数量将维度B平均分配给每一个DSP计算核心，并获取每一个DSP计算核心各自被划分到的维度的起始编号ch以及维度的总数ch_size。3每个DSP计算核心分别按照步骤2得到的输入子块尺寸和输出子块尺寸将输入数据和输出数据分别划分成多个输入数据子块BlockINp,q和输出数据子块BlockOUTp,q，其中BlockINp,q表示第p行第q列的输入数据子块，BlockOUTp,q表示第p行第q列的输出数据子块，其中p∈[0,M-1]，q∈[0,N-1]，其中M表示划分得到的输入数据子块输出数据子块的总行数，N表示划分得到的输入数据子块输出数据子块的总列数。4每个DSP计算核心设置计数器i＝0，计数器j＝0；5每个DSP计算核心判断i是否小于M，如果是则转入步骤6，否则说明DSP端的操作已经完成，然后转入步骤16；6每个DSP计算核心判断j是否小于N，如果是则转入步骤7，否则转入步骤15；7每个DSP计算核心设置流标志位flag＝0，计数器k＝0,并将第i行第j列输入数据子块BlockINi,j中的第ch+k维数据传入输入子块存储空间stream_in[flag]对应的AM空间，并转入步骤8；8每个DSP计算核心判断k是否小于ch_size-1，如果是则转入步骤9，否则转入步骤13；9每个DSP计算核心将第i行第j列输入数据子块BlockINi,j中的第ch+k+1维数据传入输入子块存储空间stream_in[！flag]对应的AM空间，并转入步骤10，其中！表示取反操作；10每个DSP计算核心等待将第i行第j列输入数据子块BlockINi,j中的第ch+k维数据传入输入子块存储空间stream_in[flag]对应的AM空间完毕，调用计算核心函数对stream_in[flag]对应的AM空间中的第i行第j列输入数据子块BlockINi,j中的第ch+k维数据am_in进行处理，以获得计算后的结果数据am_out，将该结果数据存储在stream_out[flag]中，然后将该结果数据传入第i行第j列输出数据子块BlockOUTi,j中第ch+k维数据对应的区域，并转入步骤11；11每个DSP计算核心对flag进行取反操作。并转入步骤12；12每个DSP计算核心设置k＝k+1，并返回步骤8；13每个DSP计算核心等待将第i行第j列输入数据子块BlockINi,j中的第ch+k维数据传入输入子块存储空间stream_in[flag]对应的AM空间完毕，调用计算核心函数对stream_in[flag]对应的AM空间中的第i行第j列输入数据子块BlockINi,j中的第ch+k维数据am_in进行处理，以获得计算后的结果数据am_out，将该结果数据存储在stream_out[flag]中，然后将该结果数据传入第i行第j列输出数据子块BlockOUTi,j中第ch+k维数据对应的区域。14每个DSP计算核心设置j＝j+1，并返回步骤6；15每个DSP计算核心设置i＝i+1，并返回步骤5；16CPU将来自DSP计算核心的池化操作处理的计算结果传输到步骤1所获取的用于池化操作计算的多个参数中输出数据的指针所指向的空间。

全文数据：

权利要求：

百度查询：湖南大学一种加速异构处理器池化运算的方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种巡检方便的电容补偿柜

下一篇：一种数控机床主轴箱冷却装置

相关技术

一种巡检方便的电容补偿柜

一种数控机床主轴箱冷却装置

一种杀菌效果好的卤制品杀菌锅

一种螺旋输送装置

一种防滑型无纺布的裁剪装置

电芯和电子设备

一种液体沥青取样装置

一种家用温湿度传感器

一种连续制备五氯化磷的装置

一种用于光伏发电装置的R型回转减速机

一种梳棉机用棉条桶

一种方便维护的色谱柱箱

运算相关技术

运算装置的操作方法和运算装置_上海壁仞科技股份有限公司_202410438289.9

一种级联运算电路和运算器_广东省大湾区集成电路与系统应用研究院_202410434049.1

执行LSTM神经网络运算的装置和方法_乐鑫信息科技(上海)股份有限公司_202010775213.7

数据运算装置、方法、电子设备及存储介质_深圳云天励飞技术股份有限公司_202110808803.X

在量子计算系统上使用量子梯度运算执行属性估计_谷歌有限责任公司_202280076450.1

基于RISC-V的高速运算浮点指令扩展单元_深圳大学_202410462613.0

一种逻辑运算单元电路和加法器电路_声龙(新加坡)私人有限公司_202390000071.4

一种使用定点运算在FPGA上实现实时仿真的方法_杭州瞬迦科技有限公司_202410556327.0

一种加速异构处理器池化运算的方法和系统_湖南大学_202410270763.1

一种可调分数次幂的乘积运算电路_南京信息工程大学_202410519263.7

池化相关技术

流动池_伊鲁米纳公司_202080003621.9

一种基于图池化对比学习的网络分类算法_成都理工大学_202311595271.1

基于分层对齐和广义池化图注意力机制的图文检索方法_西安电子科技大学_202210504224.0

一种加速异构处理器池化运算的方法和系统_湖南大学_202410270763.1

一种酿酒窖池_双江小黑江酒业有限责任公司_202323045457.8

一种景观树池盖板_无锡南长生态科技有限公司_202321715796.X

一种洗手池_嘉兴市佳业厨卫科技有限公司_202322357291.7

一种清理二沉池池壁装置_鹤壁市淇滨污水处理有限责任公司_202322885037.4

一种工业废水预处理池_苏州金渠环保科技有限公司_202323139323.2

一种风景区水环境整治池_云南佳音建设工程有限公司_202323453717.5

处理器相关技术

用于垃圾处理器的研磨锤和垃圾处理器_广东美的生活电器制造有限公司_202211689866.9

着色方法和图像处理器_华为技术有限公司_202280076969.X

一种垃圾处理器_浙江润尚厨卫科技有限公司_202410560796.X

一种钢筋防腐处理器_西安亮丽电力集团有限责任公司_202410600852.8

录像信息处理方法、装置、电子设备、处理器及可读介质_云丁网络技术(北京)有限公司_201911143758.X

超标量处理器的发射队列处理方法、装置、设备及介质_宸芯科技股份有限公司_202211675818.4

数据处理方法、协处理器、电子设备及可读存储介质_龙芯中科技术股份有限公司_202410389772.2

业务流程处理方法、装置、系统、存储介质及处理器_中国建设银行股份有限公司_202410463788.3

向量处理器访存指令处理方法和系统_芯来智融半导体科技(上海)有限公司_202410331347.8

数据处理器、数据处理方法、电子设备和存储介质_北京壁仞科技开发有限公司_202410420140.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种加速异构处理器池化运算的方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务