买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海创先泰克教育科技有限公司
摘要:本发明公开了一种大模型增量训练方法、系统、设备及介质,涉及人工智能技术领域;其中方法包括:按照预设分类比率对训练数据集进行分块处理,获得多个delta单位的小型数据集;以delta单位加载所述小型数据集进行模型训练,并对当前加载的小型数据集进行计数编号,保存与当前编号相对应的模型权重;若所述模型训练发生中断,则在重启训练时读取最后编号或预设编号所对应的小型数据集和模型权重以恢复训练现场。本发明所提供的方法,能够在模型训练中断后快速恢复训练现场,并且可以在训练过程中进行增量训练。
主权项:1.一种大模型增量训练方法,其特征在于,包括:按照预设分类比率对训练数据集进行分块处理,获得多个delta单位的小型数据集;以delta单位加载所述小型数据集进行模型训练,并对当前加载的小型数据集进行计数编号,保存与当前编号相对应的模型权重;若所述模型训练发生中断,则在重启训练时读取最后编号或预设编号所对应的小型数据集和模型权重以恢复训练现场。
全文数据:
权利要求:
百度查询: 上海创先泰克教育科技有限公司 一种大模型增量训练方法、系统、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。