买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国船舶集团有限公司系统工程研究院;中船智海创新研究院有限公司
摘要:本发明实施例提供了一种基于大语言模型和强化学习的数学孪生体构建方法。该方法包括:训练一个用于生成奖励函数的大型语言模型LLM,该LLM通过微调和基于交互反馈的强化学习技术,从人类奖励中改进并受益;生成初始奖励函数,利用GPU加速的虚拟环境和组件定义,自动化筛选构建奖励函数;通过迭代进化,从LLM中采样多个独立的奖励函数输出,执行上下文奖励突变,并根据文本反馈提出改进的奖励函数;反思奖励函数,利用LLM的指令遵循和上下文改进能力,根据策略训练的文本摘要来修改现有奖励代码;进行全局优化,通过多次独立随机重启,选择最佳的奖励函数作为最终解。本方法对孪生体机理模型体系构建起到有效补充,从而更快更准确构建数字孪生体。
主权项:1.一种基于大语言模型和强化学习的数学孪生体构建方法,其特征在于,所述方法包括:步骤1,训练一个用于生成奖励函数的大型语言模型LLM,该LLM通过微调和基于交互反馈的强化学习RLIF技术,从人类奖励中改进并受益;步骤2,生成初始奖励函数,利用GPU加速的虚拟环境和组件定义,自动化筛选构建奖励函数;步骤3,通过迭代进化,从LLM中采样多个独立的奖励函数输出,执行上下文奖励突变,并根据文本反馈提出改进的奖励函数;步骤4,反思奖励函数,利用LLM的指令遵循和上下文改进能力,根据策略训练的文本摘要来修改现有奖励代码;步骤5,进行全局优化,通过多次独立随机重启,选择最佳的奖励函数作为最终解。
全文数据:
权利要求:
百度查询: 中国船舶集团有限公司系统工程研究院 中船智海创新研究院有限公司 一种基于大语言模型和强化学习的数学孪生体构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。