一种基于HER和ICM实现的改进DDPG策略方法

导航：龙图腾网> 最新专利技术> 一种基于HER和ICM实现的改进DDPG策略方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：三峡大学

摘要：一种基于HER和ICM实现的改进DDPG策略方法，步骤1：创建实验环境并构建DDPG、HER和ICM的模型；步骤2：设置训练参数并创建经验池；步骤3：初始化网络和优化器；步骤4：模型在环境中运行训练，并存储状态、动作和奖励等信息到经验池中；步骤5：使用HER算法处理经验池中的样本生成新的样本；步骤6：使用ICM计算奖励并整合奖励；步骤7：更新网络参数训练模型。本发明的目的是为了解决传统DDPG算法存在的奖励稀疏导致智能体学习缓慢和探索效率过低导致样本覆盖面窄的技术问题，而提出的一种基于HER和ICM实现的改进DDPG策略方法。

主权项：1.一种基于HER和ICM实现的改进DDPG策略方法，其特征在于，它包括以下步骤：步骤1创建实验环境并构建DDPG、HER和ICM的模型；步骤2设置训练参数并创建经验池；步骤3初始化网络和优化器；步骤4模型在环境中运行训练，并存储状态、动作和奖励等信息到经验池中；步骤5使用HER算法处理经验池中的样本生成新的样本；步骤6使用ICM计算奖励并整合奖励；步骤7计算损失函数，使用梯度下降法更新网络参数训练模型；通过以上步骤实现DDPG策略。

全文数据：

权利要求：

百度查询：三峡大学一种基于HER和ICM实现的改进DDPG策略方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种芪蛭胶囊UPLC-UV对照指纹图谱及其建立方法和应用

下一篇：一种船用电器控制箱壳体制造切割设备

相关技术

一种芪蛭胶囊UPLC-UV对照指纹图谱及其建立方法和应用

一种船用电器控制箱壳体制造切割设备

用于路基工程的防护排水预制安装施工工艺

一种轨道用螺栓紧固监控系统及方法

控制移动终端的集成电路和控制基站的集成电路

用电检测方法、装置及电子设备

一种单人辅助调整喷枪装置

密闭自洁储备补偿供水设备、系统及使用方法

用于参考信号配置的方法和设备

一种图像处理方法及电子设备

一种旋喷桩径检测系统

一种焦炉自动加热耦合控制方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于HER和ICM实现的改进DDPG策略方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务