Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜成都数默科技有限公司王伟旭获国家专利权

恭喜成都数默科技有限公司王伟旭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜成都数默科技有限公司申请的专利一种多模型协同蒸馏与动态微调模型的训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443313B

龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510033437.3,技术领域涉及:G06N20/00;该发明授权一种多模型协同蒸馏与动态微调模型的训练方法及系统是由王伟旭;严得荣;王力设计研发完成,并于2025-01-09向国家知识产权局提交的专利申请。

一种多模型协同蒸馏与动态微调模型的训练方法及系统在说明书摘要公布了:本发明涉及计算机数据处理技术领域,具体涉及一种多模型协同蒸馏与动态微调模型的训练方法及系统;该方法包括,进行数据收集,未标注数据输入到模型制作为标注数据,并与已标注数据整合为一个数据集,再划分为训练集、验证集和测试集;训练集输入到模型中,提示词引导模型生成扩展数据,使用扩展训练集训练学生模型;学生模型在验证集上评估,评估结果表明学生模型评价指标未达到期望值,则错误信息输入模型进行分析和生成数据,再调整学生模型,直至学生模型的评价指标达到期望值;该方法优点为使用多个大语言模型进行协同蒸馏,训练数据更丰富多样化,学生模型更加准确,再通过循环动态微调学生模型,使得模型精准度更高以及适应性更强。

本发明授权一种多模型协同蒸馏与动态微调模型的训练方法及系统在权利要求书中公布了:1.一种多模型协同蒸馏与动态微调模型的训练方法,其特征在于,包括如下具体步骤:步骤一:进行数据集的收集与整合,将数据集中未标注数据输入到多个大语言模型制作为标注数据,并与数据集中已标注数据再次整合为一个完整的数据集,再将其划分为训练集、验证集和测试集;将未标注数据制作为标注数据的具体方式为:将未标注数据输入到多个大语言模型中,生成标注数据;对生成的标注数据进行统计,再对统计结果取众数,作为最终的标注数据,并与数据集中已标注数据整合为一个数据集;步骤二:将训练集输入到多个大语言模型当中,通过提示词引导多个大语言模型生成扩展数据,将扩展后的数据加入扩展训练集,使用扩展训练集训练一个学生模型;步骤二中选用不同的提示词包括“生成选择正确答案的理由”和“生成更多的问题”;提示词“生成选择正确答案的理由”,引导多个大语言模型生成选择答案的解释和理由;提示词“生成更多的问题”,引导多个大语言模型生成题目;扩展训练集包括原始问题、生成的新问题、新生成问题的答案和生成答案的理由;步骤三:将训练后的学生模型在验证集上评估,根据评估结果进行判断,若评估结果表明学生模型评价指标未达到期望值,则将错误信息输入多个大语言模型进行分析和生成数据,再根据分析和生成的数据调整学生模型,如此循环动态调整学生模型,直至学生模型的评价指标达到期望值,结束调整;步骤三中分析和生成数据的具体方式为:对学生模型在验证集上的错误回答进行分析,根据错误信息,生成问题和选项,这些新生成的问题和选项输入到多个大语言模型进行训练,大语言模型根据错误信息重新生成新的错误的问题及其答案,将其补充到用于调整学生模型的训练集中,再将训练集输入到学生模型进行循环动态调整;循环动态调整学生模型时,当循环调整次数大于设置的循环动态调整的最大循环次数,则认为模型已经达到调整极限,结束调整。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都数默科技有限公司,其通讯地址为:610000 四川省成都市中国(四川)自由贸易试验区成都高新区天府大道北段28号1栋2单元15层06号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。