一种提高模型推断精度的量化方法

导航：龙图腾网> 最新专利技术> 一种提高模型推断精度的量化方法

申请/专利权人：百度(美国)有限责任公司

申请日：2019-12-10

公开（公告）日：2024-06-25

公开（公告）号：CN111931922B

主分类号：G06N3/063

分类号：G06N3/063;G06N3/08

优先权：["20190513 US 16/411,098"]

专利状态码：有效-授权

法律状态：2024.06.25#授权;2020.12.01#实质审查的生效;2020.11.13#公开

摘要：本公开描述了用于量化训练的神经网络模型的各种实施方式。在一个实施方式中，描述了一种两阶段量化方法。在离线阶段，对于每个层，在每信道的基础上，将该神经网络模型的静态生成的元数据例如权重和偏差从浮点数量化成较低位宽的整数。动态生成的元数据例如，输入特征映射不在该离线阶段量化。相反，对于每个层，在每信道的基础上，为该动态生成的元数据生成量化模型。这些量化模型和该量化的元数据可以存储在量化元文件中，该量化元文件可以作为该神经网络模型的一部分部署到AI引擎中以便执行。一个或多个特殊编程的硬件部件可以基于该量化元文件中的信息来量化该神经网络模型的每个层。

主权项：1.一种在集成电路内执行的方法，包括：在具有在集成电路内实现的多个层的基于硬件的神经网络模型的第一层处接收输入特征映射，其中所述输入特征映射由第一位宽的整数表示；以及针对与所述输入特征映射相关联的多个信道中的每个信道，基于与所述神经网络模型相关联的元文件，确定与所述信道相关联的量化模型，其中，所述元文件包括所述量化模型和量化数据，所述元文件由所述集成电路外的离线量化工具预先生成并被部署至联接于所述集成电路的主机中，所述量化模型指定所述第一位宽的整数的范围以及第二位宽的整数的类型，所述量化数据指定所述神经网络模型的量化的权重和偏差，并且基于所述量化模型，在所述信道处将所述输入特征映射从所述第一位宽的第一组整数量化成所述第二位宽的第二组整数。

全文数据：

权利要求：

百度查询：百度(美国)有限责任公司一种提高模型推断精度的量化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种杀菌效果好的卤制品杀菌锅

下一篇：一种宽度紧凑型半导体封装结构

相关技术

一种杀菌效果好的卤制品杀菌锅

一种宽度紧凑型半导体封装结构

一种脱模剂集中供料装置

一种摆动机构及鼓风干燥箱

一种自动开盖的压力烹饪器具

一种数控机床主轴箱冷却装置

电芯和电子设备

一种汽车质量块加工用刀具

一种生态护坡绿化模块

一种薄荷醇制取用原料粉碎装置

一种隐框式岩板蜂窝复合板

一种用于无级变速器的传动带金属环结构

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种提高模型推断精度的量化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务