一种基于AI大模型的辅助决策方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：厦门渊亭信息科技有限公司

摘要：本发明涉及强化学习技术领域，公开了一种基于AI大模型的辅助决策方法及系统，在虚拟环境下的军事训练中，采用强化学习训练的智能体来作为对抗方辅助指挥官进行训练，其中，智能体在线训练机制包括以下步骤：采集训练数据，编码为观测向量；智能体根据采取的信息选择一个第一动作；智能体执行动作之后获得奖励并且存储经验到经验回放池；智能体通过训练好的第一神经网络获得训练启动的时刻和采集的经验数；到达启动时刻后采集经验启动训练。本发明可以通过提供一种智能体在线训练机制，可以有效地分配服务器的数据处理任务，从而使服务器的处理能力需求的峰值降低，并且保证了智能体的对抗强度。

主权项：1.一种基于AI大模型的辅助决策方法，其特征在于，智能体的在线训练包括以下步骤：步骤100，采集训练数据，编码为观测向量；步骤200，将当前采集获得的观测向量输入到DQN模型中，输出第一动作空间中所有第一动作对应的Q值，使用第一动作选择策略从所有第一动作中选择一个第一动作解码并执行；步骤300，定义t时刻为当前的时刻，t时刻采取的第一动作为，执行第一动作之后的t+1时刻采集的观测向量，执行第一动作获得的奖励，组合成高维向量exp存放到经验回放池中；，表示t时刻采集的观测向量；步骤400，将t-n时刻至t时刻的观测向量输入到训练好的第一神经网络中，输出训练启动的时刻和训练采集的经验数，当到达训练启动的时刻时，从经验回放池中采集对应的经验数对DQN模型进行训练。

全文数据：

权利要求：

百度查询：厦门渊亭信息科技有限公司一种基于AI大模型的辅助决策方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光学瞄准镜防震动冲击转换装置

下一篇：一种基于改进蚁群算法的飞机低空突防航线规划方法

相关技术

光学瞄准镜防震动冲击转换装置

一种基于改进蚁群算法的飞机低空突防航线规划方法

针刺式固晶机

测定气氛烧结炉内气氛一致性的方法

一种装配式钢与混凝土组合楼梯

一种基于红外摄像头与定位识别垫的人机协作与预防人机碰撞的系统及方法

一种基于GLSL ES的图像渲染方法及装置

一种含梯级水电的电力市场出清方法、装置、设备及介质

一种多通道绿化带快速种植设备及其工作方法

近红外线吸收玻璃及近红外线截止滤光片

显示装置

一种卡式造型龙骨及其造型结构

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于AI大模型的辅助决策方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务