大语言模型的训练方法及装置

导航：龙图腾网> 最新专利技术> 大语言模型的训练方法及装置

申请/专利权人：支付宝(杭州)信息技术有限公司

申请日：2024-01-22

公开（公告）日：2024-06-25

公开（公告）号：CN118246505A

主分类号：G06N3/08

分类号：G06N3/08;G06N3/0442;G06N3/042;G06N3/045;G06N3/096;G06N3/0499;G06N3/084

优先权：

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：本说明书实施例提供一种大语言模型的训练方法及装置，以及一种预测模型的训练方法及装置。其中大语言模型的训练方法包括：首先，将训练样本的样本特征输入大语言模型，得到对应的预测结果；该训练样本包括自然语言文本，大语言模型包括混合专家神经网络MoE，所述MoE网络包括门控网络和多个专家网络。接着，基于所述预测结果和所述训练样本的样本标签，确定任务损失项；以及，基于所述多个专家网络对应的多个输出，确定蒸馏损失项；所述多个专家网络之间互为蒸馏学习中的学生和老师。之后，基于所述任务损失项和蒸馏损失项，训练所述大语言模型。

主权项：1.一种大语言模型的训练方法，包括：将训练样本的样本特征输入大语言模型，得到对应的预测结果；其中，所述训练样本包括自然语言文本，所述大语言模型包括混合专家神经网络MoE，所述MoE网络包括门控网络和多个专家网络；基于所述预测结果和所述训练样本的样本标签，确定任务损失项；基于所述多个专家网络对应的多个输出，确定蒸馏损失项；所述多个专家网络之间互为蒸馏学习中的学生和老师；基于所述任务损失项和蒸馏损失项，训练所述大语言模型。

全文数据：

权利要求：

百度查询：支付宝(杭州)信息技术有限公司大语言模型的训练方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种实时监测并控制化锡线硫化氢气体的装置

下一篇：一种纸尿裤生产用包边机

相关技术

一种实时监测并控制化锡线硫化氢气体的装置

一种纸尿裤生产用包边机

一种杀菌效果好的卤制品杀菌锅

一种预应力钢绞线辅助穿束防缠绕工具

一种酶转化罐内部恒温搅拌机构

一种数控机床主轴箱冷却装置

一种砂浆压实装置

一种可移动式智能温控糖化槽生产线

一种用于塑料制品生产的表面加工装置

一种细分子印刷喷粉加工用研磨装置

一种地铁车辆车钩检修用辅助工具

一种自动开盖的压力烹饪器具

语言相关技术

基于大语言模型的自然语言数据分析方法及系统_北京尚博信科技有限公司_202410549288.1

基于大语言模型的信息提取装置、方法_山东浪潮科学研究院有限公司_202410203010.9

多任务大语言模型训练方法及装置_支付宝(杭州)信息技术有限公司_202410473352.2

一种多语言混合智能翻译方法_江苏省舜禹信息技术有限公司_202011359255.9

训练大语言模型的方法、装置、电子设备_北京百川智能科技有限公司_202311856910.5

用于为预训练的语言模型处置长文本的系统和技术_甲骨文国际公司_202280076746.3

一种基于Modelica语言的离散式动态集热器的建模方法_南京远思智能科技有限公司_202410508263.7

自然语言的处理方法、装置、设备、介质和程序产品_中国工商银行股份有限公司_202410353899.9

一种基于大语言模型的文本搜索匹配方法和系统_公安部第三研究所_202410368833.7

一种基于视觉语言模型的自动导引车导航方法及装置_浙江大学湖州研究院_202410674459.3

模型相关技术

电池模型校准_瑞维安知识产权控股有限责任公司_202311046344.1

决策树模型的模型隐私、数据隐私及模型一致性保护方法_南开大学_202311115522.1

模型调整方法及其装置_维沃移动通信有限公司_202410356220.1

一种展示模型_微山县土地资源事务服务中心_202322685404.6

建筑信息模型BIM模型数据处理方法、装置、电子设备和存储介质_江苏国贸酝领智能科技股份有限公司_202410310514.0

一种基于病理大模型的目标检测模型构建方法_北京透彻未来科技有限公司_202410428564.9

大语言模型的训练方法、利用大语言模型生成代码的方法_上海数中科技有限公司_202410370582.6

三维模型生成方法以及三维模型生成装置_松下知识产权经营株式会社_202280076021.4

OSAHS识别方法、模型、模型建立方法、及装置_孙书军_202110563785.3

基于水声物理模型的闭环自监督深度学习模型训练方法_中国船舶集团有限公司第七一五研究所_202410133840.9

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

坏点检测模型训练方法、坏点检测方法以及坏点修复方法_京东方科技集团股份有限公司_202280003858.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

大语言模型的训练方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务