首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习集成框架的伴随计算策略优化迭代方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军军事科学院战争研究院

摘要:本发明公开了一种基于强化学习集成框架的伴随计算策略优化迭代方法,本发明涉及深度学习领域,包括以下步骤:获取不同类型的强化学习方式,根据其分类依据构建多元智能体集成框架,其中包括架构方案层、模式类型层、优化方向层、训练策略层和表征方法层;获取任务数据信息,将其划分为任务模块;获取任务模块的环境数据和任务数据,根据环境数据和任务数据依次在模式类型层、优化方向层、训练策略层和表征方法层中进行分析处理,依次获取对应模式类型、优化方向、训练策略和表征方法对应的强化学习方式,获取对应的强化学习策略;本发明在一定程度上提高了任务数据在分析过程中的训练策略选择的多样性,使得数据分类类型更为广泛。

主权项:1.一种基于强化学习集成框架的伴随计算策略优化迭代方法,其特征在于,包括以下步骤:步骤S1:获取不同类型的强化学习方式,根据其分类依据构建多元智能体集成框架,其中包括架构方案层、模式类型层、优化方向层、训练策略层和表征方法层;步骤S2:获取任务数据信息,对所获得的任务数据信息进行复杂程度划分,根据划分结果选择是否将其进行解构和划分;将对应任务划分的任务进行标记,并记为若干的任务模块;步骤S3:获取各个任务模块的环境数据,根据对应的环境数据将其与模式类型层的模式类型进行匹配,根据匹配结果获取对应智能体分析过程中的模式类型;步骤S4:获取对应任务模块对应的模式类型,通过优化方向层选取对应的优化方向对强化学习算法进行优化;步骤S5:获取对应任务模块的优化方向,根据优化方向通过训练策略层获取对应的训练策略;步骤S6:获取任务数据信息的应用场景,根据所选择的训练策略通过表征方法层设置对应的训练策略的输入输出的表征方式。

全文数据:

权利要求:

百度查询: 中国人民解放军军事科学院战争研究院 一种基于强化学习集成框架的伴随计算策略优化迭代方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。