首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

执行LSTM神经网络运算的装置和方法 

申请/专利权人:乐鑫信息科技(上海)股份有限公司

申请日:2020-08-03

公开(公告)日:2024-06-28

公开(公告)号:CN111898752B

主分类号:G06N3/082

分类号:G06N3/082;G06N3/0464;G06N3/0442;G06N3/049

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2020.11.24#实质审查的生效;2020.11.06#公开

摘要:执行LSTM神经网络运算的装置和方法,装置包括处理器、第一和第二运算模块,及存取速度依次递减的处理器缓存、主存储器和次级存储器;第一运算模块可读取当前层的K帧的输入向量和参数矩阵的第一子矩阵的一行至处理器缓存,处理器对K帧输入向量逐一与第一子矩阵的一行执行乘加运算,直至遍历第一子矩阵的所有行,以得到对应于K帧的第一中间结果向量,其中K大于1且选择为使得K帧输入向量及第一子矩阵的一行尺寸小于处理器缓存尺寸;第二运算模块可使得对于K帧中的每帧,据参数矩阵的第二子矩阵、第一中间结果向量及上一帧输出向量,计算出每帧对应的第二中间结果向量;及据第一和第二中间结果向量,更新门控及状态向量,计算当前帧输出向量。

主权项:1.一种执行LSTM神经网络运算的装置,其特征在于,包括:处理器、处理器缓存、主存储器、次级存储器、第一运算模块,以及第二运算模块,其中所述处理器可操作以将所述主存储器和或所述次级存储器中的数据读取到所述处理器缓存中进行处理,其中所述处理器缓存的存取速度高于所述主存储器的存取速度,所述主存储器的存取速度高于所述次级存储器的存取速度;所述第一运算模块可操作以将当前层的K个帧的输入向量读取至所述处理器缓存中,并逐一读取LSTM参数矩阵的第一子矩阵的一行至所述处理器缓存中,由所述处理器对所述K个帧的输入向量逐一与所述第一子矩阵的一行执行乘加运算,直至遍历所述第一子矩阵的所有行,以得到对应于所述K个帧中的每个帧的第一中间结果向量,其中,K大于1且K选择为使得所述K个帧的输入向量以及LSTM参数矩阵的第一子矩阵的一行的尺寸小于所述处理器缓存的尺寸;所述第二运算模块可操作以使得对于所述K个帧中的每个帧:由所述处理器根据所述LSTM参数矩阵的第二子矩阵、所述第一中间结果向量以及上一帧LSTM输出向量,计算出每个帧对应的第二中间结果向量;及根据所述第一中间结果向量和所述第二中间结果向量,更新LSTM门控向量以及LSTM状态向量,计算出当前帧的LSTM输出向量。

全文数据:

权利要求:

百度查询: 乐鑫信息科技(上海)股份有限公司 执行LSTM神经网络运算的装置和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。