首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于RISC-V扩展指令的量化神经网络加速处理器 

申请/专利权人:浙江大学

申请日:2023-11-24

公开(公告)日:2024-06-28

公开(公告)号:CN117634569B

主分类号:G06N3/063

分类号:G06N3/063;G06F9/38;G06F9/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本发明公开了一种基于RISC‑V扩展指令的量化神经网络加速处理器。该处理器采取了由取指、译码、执行、写回构成的四级流水线结构。该处理器支持自定义扩展的高数据位宽指令集,从而提高计算并行度,加快运算效率。相应地,处理器内部扩展三条不同数据位宽的数据通路和对应的寄存器组,以支持对神经网络的分组量化和并行计算。处理器通过支持扩展指令集的计算单元和查找表实现了对卷积层和激活函数的快速计算,并通过动态定点计算提高对分组量化神经网络的适应性和计算精度。本发明具有计算效率高、能耗低、应用范围广的优点。

主权项:1.一种RISC-V扩展指令的量化神经网络加速处理器,其特征在于,包括:取指模块、译码模块、执行模块、写回模块、数据通路模块以及控制器;所述取指模块用于从外部总线获取由外部神经网络模型转换的指令,判断获取的指令是否为压缩指令,若获取的指令不是压缩指令则直接输送到译码模块,若获取的指令是压缩指令则将压缩指令进行解译后输送到译码模块;所述译码模块包括译码器和寄存器组,所述译码器用于对取指模块输送的指令进行译码得到指令控制信号;所述寄存器组用于储存译码器产生的指令控制信号的地址以及写回模块传输的写回数据;所述执行模块包括算术执行模组和状态寄存器,所述算术执行模组用于根据译码模块译码得到的指令控制信号执行具体的计算或对译码模块的寄存器组进行访存操作,所述状态寄存器用于存储处理器中各模块的状态信息;所述执行模块包括状态寄存器、乘法模块、算术逻辑单元、向量算术逻辑单元和查找表,所述乘法模块用于进行计算32位乘法、向量定点与动态定点的乘法和乘加运算,所述算术逻辑单元用于计算32位数据的算术逻辑运算;所述向量算术逻辑单元用于计算向量动态定点以及定点逻辑运算、非线性激活函数计算;所述查找表用于存储激活函数对应的计算结果并用于支持扩展指令中激活函数的计算;乘法模块中动态定点的乘法和乘加运算、向量算术逻辑单元中的量动态定点运算均为动态定点计算;在进行动态定点计算时需要用到的计算资源包括16个用于乘法计算的8位乘法器、16个用于加法运算和乘加运算的8位加法器、3个128位移位器;其中,移位器在乘法运算、加法运算、乘加运算中被复用;加法器和乘法器在定点运算中被复用;所述写回模块用于与外部总线进行数据交互并将读取得到的数据以及执行模块的计算结果写回译码模块的寄存器组或执行模块的算术执行模组中;所述数据通路模块包括数据通路位宽分别为32比特、128比特和136比特的三条数据通路;32比特的数据通路用于译码模块、执行模块和写回模块之间32比特数据的传输;128比特的数据通路用于与外部数据进行交互;136比特的数据通路用于译码模块、执行模块和写回模块之间136比特数据的传输;所述控制器用于根据状态寄存器存储的处理器中各模块的状态信息来对处理器中各模块进行控制。

全文数据:

权利要求:

百度查询: 浙江大学 基于RISC-V扩展指令的量化神经网络加速处理器

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。