申请/专利权人:英特尔公司
申请日:2018-04-09
公开(公告)日:2024-06-14
公开(公告)号:CN112116098B
主分类号:G06N3/0495
分类号:G06N3/0495;G06N3/0499;G06N3/088;G06N3/0895;G06N3/09;G06N3/098
优先权:["20170409 US 15/482791"]
专利状态码:有效-授权
法律状态:2024.06.14#授权;2021.01.08#实质审查的生效;2020.12.22#公开
摘要:机器学习稀疏计算机制。一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
主权项:1.一种数据处理设备,包括:存储器,所述存储器用于存储张量集合;以及张量加速器,所述张量加速器耦合到所述存储器,所述张量加速器包括:硬件单元,所述硬件单元用于检测所述张量集合的压缩表示内的稀疏性模式,其中将要检测所述张量集合内的所述稀疏性模式包括将要确定所述张量集合内的非零值的行和列;缓冲器,所述缓冲器用于存储所述张量集合的元素;处理元件阵列,所述处理元件阵列用于对所述张量的所述元素执行操作,所述操作与点积操作关联,所述处理元件阵列中的每个处理元件包括用于存储所述操作的操作数的一个或多个寄存器,其中所述处理元件阵列将要:从所述缓冲器接收所述张量集合的所述元素;将从所述缓冲器接收的所述元素存储在所述处理元件阵列内的所述处理元件的所述一个或多个寄存器内;对从所述缓冲器接收的非零元素执行所述操作,所述非零元素至少部分基于在所述张量集合的所述压缩表示内检测到的所述稀疏性模式来确定;以及输出所述操作的结果。
全文数据:
权利要求:
百度查询: 英特尔公司 机器学习稀疏计算机制
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。