一种基于强化学习集成框架的伴随计算策略优化迭代方法

导航：龙图腾网> 最新专利技术> 一种基于强化学习集成框架的伴随计算策略优化迭代方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军军事科学院战争研究院

摘要：本发明公开了一种基于强化学习集成框架的伴随计算策略优化迭代方法，本发明涉及深度学习领域，包括以下步骤：获取不同类型的强化学习方式，根据其分类依据构建多元智能体集成框架，其中包括架构方案层、模式类型层、优化方向层、训练策略层和表征方法层；获取任务数据信息，将其划分为任务模块；获取任务模块的环境数据和任务数据，根据环境数据和任务数据依次在模式类型层、优化方向层、训练策略层和表征方法层中进行分析处理，依次获取对应模式类型、优化方向、训练策略和表征方法对应的强化学习方式，获取对应的强化学习策略；本发明在一定程度上提高了任务数据在分析过程中的训练策略选择的多样性，使得数据分类类型更为广泛。

主权项：1.一种基于强化学习集成框架的伴随计算策略优化迭代方法，其特征在于，包括以下步骤：步骤S1：获取不同类型的强化学习方式，根据其分类依据构建多元智能体集成框架，其中包括架构方案层、模式类型层、优化方向层、训练策略层和表征方法层；步骤S2：获取任务数据信息，对所获得的任务数据信息进行复杂程度划分，根据划分结果选择是否将其进行解构和划分；将对应任务划分的任务进行标记，并记为若干的任务模块；步骤S3：获取各个任务模块的环境数据，根据对应的环境数据将其与模式类型层的模式类型进行匹配，根据匹配结果获取对应智能体分析过程中的模式类型；步骤S4：获取对应任务模块对应的模式类型，通过优化方向层选取对应的优化方向对强化学习算法进行优化；步骤S5：获取对应任务模块的优化方向，根据优化方向通过训练策略层获取对应的训练策略；步骤S6：获取任务数据信息的应用场景，根据所选择的训练策略通过表征方法层设置对应的训练策略的输入输出的表征方式。

全文数据：

权利要求：

百度查询：中国人民解放军军事科学院战争研究院一种基于强化学习集成框架的伴随计算策略优化迭代方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种烟叶分拣定级用的翻转分料装置及方法

下一篇：一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

相关技术

一种烟叶分拣定级用的翻转分料装置及方法

一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

用于抓毛织物表面形貌的检测方法

一种惯性传感器探头装置及多自由度检测方法

一种模块化储能柜充放电优化控制方法及系统

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

一种不等厚火山口玻璃后盖周抛方法

一株马立克病病毒双基因编辑缺失疫苗株SD01ΔmeqΔM11及构建和应用

电池单体、储能设备及用电装置

一种大数据检索方法、装置以及可读存储介质

一种多自由度解耦的波浪能发电装置及其工作方法

一种重型机械龙门自动焊接装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习集成框架的伴随计算策略优化迭代方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务