【发明公布】一种基于词元树早期剪枝的自回归模型并行解码方法_北京大学_202410034895.4

导航：龙图腾网> 最新专利技术> 一种基于词元树早期剪枝的自回归模型并行解码方法_北京大学_202410034895.4

申请/专利权人：北京大学

申请日：2024-01-10

公开（公告）日：2024-06-11

公开（公告）号：CN118171635A

主分类号：G06F40/146

分类号：G06F40/146;G06F40/126;G06F40/205;G06N5/01;G06N5/04

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.28#实质审查的生效;2024.06.11#公开

摘要：本发明提供一种基于词元树早期剪枝的自回归模型并行解码方法，属于深度学习领域。本发明首先进行并行解码头的训练，使用并行解码块对于后续位置进行预测，然后使用早期剪枝算法对词元树中的不合理的分支进行修剪，最终通过自回归解码头对词元树中所有节点进行验证。采用本发明可以提升解码效率。

主权项：1.一种基于词元树早期剪枝的自回归模型并行解码方法，其具体步骤包括：步骤1：给定自回归的大语言模型M，训练m个预测后续位置的并行解码头pd1，...，pdm；步骤2：给定自回归的大语言模型M，训练早期层的解码头ed；步骤3：在推理流程中，将输入的单条数据记作seq，计算输入数据通过模型的输出h＝Mseq[-1，：]，将模型的自回归解码头记作ad，计算对下一个词元的概率分布adh和后续m个位置输出概率分布的预测pd1h，...，pdmh；步骤4：构建一个词元树T，每个树节点代表一个潜在的词元选择，树的每一层对应一个并行解码头的输出，根节点表示当前生成的序列，子节点表示在此基础上可能的下一个词元；步骤5：在词元树T的验证过程中，使用线性列表存储树结构，通过遍历词元树并将每个节点按照广度优先的顺序存入一个列表来实现线性存储树；步骤6：在词元树T的构建和推理过程中，在模型M计算完成n个transformer块的输出后，立即对词元树进行剪枝处理，其中n≥3；步骤7：使用大模型M对词元树T进行计算，获得每个节点对应的隐藏层输出，并行验证每一个候选序列中的每一个词元，并最终选出具有最长接受长度的序列，记作acc_seq，如果[EOF]∈acc_seq，即产生了结束字符，则代表结束生成任务，返回所有输出结果，否则，进入步骤4重复进行，直到结束生成任务。

全文数据：

权利要求：

百度查询：北京大学一种基于词元树早期剪枝的自回归模型并行解码方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：跨平台数据关联方法、装置、电子设备及计算机存储介质_深圳市云积分科技有限公司_202410398091.2

下一篇：显示面板和显示装置_京东方科技集团股份有限公司_202410536376.8

相关技术

跨平台数据关联方法、装置、电子设备及计算机存储介质_深圳市云积分科技有限公司_202410398091.2

显示面板和显示装置_京东方科技集团股份有限公司_202410536376.8

一种导热碳纳米管接枝胺化环氧树脂及其制备方法_福州大学_202410498451.6

一种智能无线食物投喂装置及其控制方法_厦门盈趣科技股份有限公司_202410306156.6

止血夹用内外夹结构_浙江微度医疗器械有限公司_202410541260.3

一种山茱萸多糖-壳聚糖复合膜及其制备方法_河南喜食散生物科技有限公司_202410331541.6

一种云服务器访问控制方法及装置_中国工商银行股份有限公司_202410427623.0

一种防溢水排水装置_佛山市意特美玻璃工艺有限公司_202410531035.1

一种自适应外肋骨大型筒体施工作业平台_武昌船舶重工集团有限公司_202410542055.9

铸铁孕育剂和生产铸铁孕育剂的方法_埃尔凯姆公司_202410341971.6

一种基于元学习的小样本开集增量学习的射频指纹识别方法和装置_浙江工业大学_202410334573.1

一种辅助头部手术定位设备及其定位系统_山西嗨探科科技有限公司_202410442801.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于词元树早期剪枝的自回归模型并行解码方法_北京大学_202410034895.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务