买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆邮电大学
摘要:本发明涉及一种基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法,属于循环神经网络加速器领域。该加速器包括控制模块、重构模块、激活模块和多个脉动阵列,控制模块负责全局调配,尤其是实现在脉动阵列中将权重数据与输入数据耦合相乘;重构模块通过将输入的单个数据缓存并维度重构,使其符合脉动阵列的输入维度;脉动阵列负责实现4个门和全连接层的运算,其中通过脉动的方式传递并计算数据,以减少计算单元的空置率并提高计算效率;本发明在对LSTM网络进行训练时,采用分层分模块轻量化重训练,在使权重参数规模减少的同时保持准确率,本发明提出的LSTM加速器相对于通用处理器具有高能效、高算力的特点。
主权项:1.基于分布式计算脉动阵列的轻量化LSTM硬件加速器,其特征在于:包括控制模块、重构模块、激活模块和多个脉动阵列;所述控制模块,主体由状态机构成,控制加速器的运行状态转换,以及实时调配数据的输入与输出;所述重构模块,主体由寄存器构成,实现将输入的单个数据缓存并进行维度重构,使其符合脉动阵列的输入数据维度再进行输出;所述激活模块,通过分段线性拟合的方式实现Sigmoid函数和Tanh函数,通过数据类比的方式实现Softmax函数;所述脉动阵列,主体由多个计算单元PE组成,通过脉动的方式传递并计算数据,以减少计算单元的空置率并提高计算效率。
全文数据:
权利要求:
百度查询: 重庆邮电大学 基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。