买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州亿铸智能科技有限公司;上海交通大学
摘要:本申请公开一种模型量化方法,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。本申请还提供一种模型量化装置、电子设备及存储介质,可以灵活选择权重的位宽,在保证压缩效率的同时减少精度损失。
主权项:1.一种模型量化方法,其特征在于,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度,其中,当所述目标权重块的量化偏差小于所述量化阈值时,所述目标权重块的量化精度为第一精度;当所述目标权重块的量化偏差大于等于所述量化阈值时,所述目标权重块的量化精度为第二精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上,其中,按位交错的映射方式为将同一权重值的不同位分别映射至多个交叉阵列单元的同一位置;根据不同量化权重块的量化精度控制多个交叉阵列单元的输出结果的移位操作;当所述量化权重块的量化精度为第一精度时,将多个交叉阵列单元的输出结果直接输出;当所述量化权重块的量化精度为第二精度时,将部分交叉阵列单元的输出结果进行移位和其他交叉阵列单元的输出结果合并后输出。
全文数据:
权利要求:
百度查询: 苏州亿铸智能科技有限公司 上海交通大学 模型量化方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。