买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:英特尔公司
摘要:本申请公开了用于8位浮点矩阵点积指令的装置、方法和系统。描述了涉及8位浮点矩阵点积指令的系统、方法和装置。处理器实施例包括:取出电路,用于取出指令,该指令具有用于指定操作码和具有单精度元素的目的地矩阵的位置、第一源矩阵的位置和第二源矩阵的位置的字段,源矩阵具有各自包括8位浮点值的四元组的元素,该操作码用于指示执行电路用于引起:对于第一源矩阵的每个元素和第二源矩阵的对应元素,将8位浮点值转换为单精度值,将不同对的经转换的单精度值相乘以生成多个结果,并且将结果与目的地矩阵的对应元素的先前内容累加;解码电路,用于对所取出的指令解码;以及执行电路,用于如操作码所指定地对经解码的指令作出响应。
主权项:1.一种处理器,包括:多个向量寄存器,用于存储多个紧缩数据元素,包括8位浮点数据元素和32位浮点数据元素;解码电路,用于对单条矩阵乘法指令解码,所述单条矩阵乘法指令具有用于指示操作码以及M乘K第一源矩阵、K乘N第二源矩阵和M乘N第三源矩阵的位置的字段,所述M乘K第一源矩阵包括第一多个8位浮点数据元素,所述K乘N第二源矩阵包括第二多个8位浮点数据元素,所述M乘N第三源矩阵具有多个32位浮点数据元素,所述第一多个8位浮点数据元素和所述第二多个8位浮点数据元素中的每一个8位浮点数据元素包括符号位、5位的指数值、和2位的尾数值;以及执行电路,包括用于加速矩阵操作的矩阵加速电路,其中响应于所述单条矩阵乘法指令,所述执行电路用于基于所述第一多个8位浮点数据元素的对应行和所述第二多个8位浮点数据元素的对应列来生成结果矩阵的每个32位浮点结果数据元素,所述执行电路用于生成与所述第一多个8位浮点数据元素的对应行和所述第二多个8位浮点数据元素的对应列对应的相应多个乘积并且将所述多个乘积与所述第三源矩阵的对应的32位浮点数据元素累加以生成所述结果矩阵的32位浮点结果数据元素。
全文数据:
权利要求:
百度查询: 英特尔公司 用于8位浮点矩阵点积指令的装置、方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。