Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜语仓科技(北京)有限公司宋福海获国家专利权

恭喜语仓科技(北京)有限公司宋福海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜语仓科技(北京)有限公司申请的专利一种全模态大模型的训练方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119514698B

龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510088742.2,技术领域涉及:G06N5/04;该发明授权一种全模态大模型的训练方法、装置、设备及介质是由宋福海;李世奇;夏博;李国东设计研发完成,并于2025-01-21向国家知识产权局提交的专利申请。

一种全模态大模型的训练方法、装置、设备及介质在说明书摘要公布了:本申请公开了一种全模态大模型的训练方法、装置、设备及介质,涉及模型训练领域,该方法包括:采用经验回放池存储旧任务的样本数据;其中,旧任务为全模态大模型已经学习过的任务,样本数据包括多种模态的数据;当全模态大模型学习新任务时,根据新任务的样本数据及经验回放池中存储的旧任务的样本数据,对全模态大模型进行多轮训练,并在训练过程中根据全模态大模型在旧任务的样本数据上的准确率,动态调整新任务的样本数据与旧任务的样本数据的比例,以得到联合训练后的全模态大模型。本申请解决了全模态大模型的灾难性遗忘问题,提高了全模态大模型的长期记忆能力,确保其在不断学习新任务的过程中保持高性能。

本发明授权一种全模态大模型的训练方法、装置、设备及介质在权利要求书中公布了:1.一种全模态大模型的训练方法,其特征在于,所述全模态大模型的训练方法包括:采用经验回放池存储旧任务的样本数据,具体包括:采用经验回放池分层存储每种模态的数据,并在每一层中根据旧任务的相关性将数据分组存储;其中,旧任务为全模态大模型已经学习过的任务,所述样本数据包括多种模态的数据;当全模态大模型学习新任务时,根据新任务的样本数据及所述经验回放池中存储的旧任务的样本数据,对所述全模态大模型进行多轮训练,并在训练过程中根据全模态大模型在旧任务的样本数据上的准确率,动态调整新任务的样本数据与旧任务的样本数据的比例,以得到联合训练后的全模态大模型;从所述经验回放池中选取与新任务的相关性大于设定阈值的旧任务的样本数据作为旧任务样本;根据所述旧任务样本和所述新任务的样本数据,对联合训练后的全模态大模型进行多轮训练,以得到训练好的全模态大模型;具体从经验回放池中随机抽取α×B个旧任务的样本数据,同时通过计算新任务的样本数据与旧任务的样本数据的特征KL散度,优先选择与新任务模态相关性较高的样本数据;从每种模态的新任务的样本数据中随机抽取1-α×B个样本,将抽取的旧任务样本和新任务样本混合,组成完整的训练批次,并使用这些样本进行全模态大模型的训练;其中,B为样本批次大小,α为旧任务的样本数据的比例;多种模态的数据分别为语音、图像及文本;所述新任务和所述旧任务均包括语音识别任务、图像分类任务及文本生成任务;所述全模态大模型为多模态智能问答系统;所述多模态智能问答系统用于接收语音、图像及文本,并根据所述语音执行语音识别任务,将所述语音转化为文本,根据所述图像执行图像分类任务,对图像进行分类,根据所述文本及图像分类结果执行文本生成任务,生成自然语言的回答。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语仓科技(北京)有限公司,其通讯地址为:100033 北京市海淀区上地东路1号院盈创动力A座北厅901;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。