首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于高效并行算法的多模态大模型训练方法 

申请/专利权人:北京荆跃科技有限公司

申请日:2024-05-23

公开(公告)日:2024-06-28

公开(公告)号:CN118260566A

主分类号:G06F18/21

分类号:G06F18/21;G06F18/25

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明涉及计算机技术领域,尤其涉及一种基于高效并行算法的多模态大模型训练方法,包括步骤S1,对文本数据进行预处理;步骤S2,对图像数据进行预处理;步骤S3,进行关联性处理;步骤S4,对图像数据预处理过程进行调整;步骤S5,对关联性处理后的数据进行数据融合;步骤S6,进行数据划分,得到训练集和测试集;步骤S7,对模型进行训练;步骤S8,对模型进行输出判断;步骤S9,对输出判断结果为输出失败的模型的学习率进行调整;步骤S10,对模型隐藏层进行优化设置;步骤S11,对图像数据预处理过程进行调整;步骤S12,进行实际场景优化训练。本发明通过对多模态数据进行区分预处理,并根据实际场景进行训练优化,提高了多模态大模型训练效率。

主权项:1.一种基于高效并行算法的多模态大模型训练方法,其特征在于,包括:步骤S1,对文本数据进行预处理;步骤S2,对图像数据进行预处理;步骤S3,对预处理后的文本数据和图像数据进行关联性处理;步骤S4,根据数据的关联数据量对数据特性进行判断,并根据判断结果对图像数据预处理过程进行调整;步骤S5,对关联性处理后的数据进行数据融合;步骤S6,对数据融合后的数据进行数据划分,得到训练集和测试集;步骤S7,根据训练集对模型进行训练;步骤S8,根据测试集对训练后的模型进行测试,并根据测试集准确率对模型进行输出判断;步骤S9,对输出判断结果为输出失败的模型的学习率进行调整;步骤S10,根据学习率调整次数对模型隐藏层进行优化设置;步骤S11,根据输出失败的模型中测试集的错误判断数据的数据属性对图像数据预处理过程进行调整;步骤S12,对输出判断结果为输出成功的模型进行实际场景优化训练。

全文数据:

权利要求:

百度查询: 北京荆跃科技有限公司 一种基于高效并行算法的多模态大模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。