首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种提高模型推断精度的量化方法 

申请/专利权人:百度(美国)有限责任公司

申请日:2019-12-10

公开(公告)日:2024-06-25

公开(公告)号:CN111931922B

主分类号:G06N3/063

分类号:G06N3/063;G06N3/08

优先权:["20190513 US 16/411,098"]

专利状态码:有效-授权

法律状态:2024.06.25#授权;2020.12.01#实质审查的生效;2020.11.13#公开

摘要:本公开描述了用于量化训练的神经网络模型的各种实施方式。在一个实施方式中,描述了一种两阶段量化方法。在离线阶段,对于每个层,在每信道的基础上,将该神经网络模型的静态生成的元数据例如权重和偏差从浮点数量化成较低位宽的整数。动态生成的元数据例如,输入特征映射不在该离线阶段量化。相反,对于每个层,在每信道的基础上,为该动态生成的元数据生成量化模型。这些量化模型和该量化的元数据可以存储在量化元文件中,该量化元文件可以作为该神经网络模型的一部分部署到AI引擎中以便执行。一个或多个特殊编程的硬件部件可以基于该量化元文件中的信息来量化该神经网络模型的每个层。

主权项:1.一种在集成电路内执行的方法,包括:在具有在集成电路内实现的多个层的基于硬件的神经网络模型的第一层处接收输入特征映射,其中所述输入特征映射由第一位宽的整数表示;以及针对与所述输入特征映射相关联的多个信道中的每个信道,基于与所述神经网络模型相关联的元文件,确定与所述信道相关联的量化模型,其中,所述元文件包括所述量化模型和量化数据,所述元文件由所述集成电路外的离线量化工具预先生成并被部署至联接于所述集成电路的主机中,所述量化模型指定所述第一位宽的整数的范围以及第二位宽的整数的类型,所述量化数据指定所述神经网络模型的量化的权重和偏差,并且基于所述量化模型,在所述信道处将所述输入特征映射从所述第一位宽的第一组整数量化成所述第二位宽的第二组整数。

全文数据:

权利要求:

百度查询: 百度(美国)有限责任公司 一种提高模型推断精度的量化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。