一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法

导航：龙图腾网> 最新专利技术> 一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法

申请/专利权人：山东科技大学

申请日：2024-02-21

公开（公告）日：2024-06-11

公开（公告）号：CN118168549A

主分类号：G01C21/20

分类号：G01C21/20;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.28#实质审查的生效;2024.06.11#公开

摘要：本发明公开了一种基于ε‑UCB和栅格图奖励函数的移动机器人路径规划方法，首先设计基于栅格图环境的深度强化学习M‑DQN的模型；根据深度强化学习M‑DQN模型设计ε‑UCB动作决策方法，以提高探索效率；根据栅格图环境设计奖励函数，充分利用有效信息，为智能体提供引导。本发明设计了一种ε‑greedy和UCB思维相结合的ε‑UCB动作决策方法，可以有效提高探索效率并减少无意义的探索；设计了基于栅格图环境的特别奖励函数，可以对强化学习智能体起到充分的引导作用，加快收敛速度。整体算法基于M‑DQN框架，引入了动作对数信号，减小了自举问题的影响。

主权项：1.一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法，其特征在于，包括以下步骤：步骤一：设计基于栅格图环境的深度强化学习M-DQN的模型；步骤二：根据深度强化学习M-DQN模型设计ε-UCB动作决策方法，以提高探索效率；步骤三：根据栅格图环境设计奖励函数，充分利用有效信息，为智能体提供引导。

全文数据：

权利要求：

百度查询：山东科技大学一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于车辆顶板的显示装置和车辆

下一篇：一种金属管件抛光打磨装置

相关技术

用于车辆顶板的显示装置和车辆

一种金属管件抛光打磨装置

一种稳固性良好的电动自行车

一种具有调节功能的塑料藤条结构椅

一种散热机箱

一种裁断效果好的液压裁断机

一种多功能存储罐应急逃生梯

一种便于移动的展开式箱房

一种船舶舷外机通风型保护罩

一种装配式铝方通转角拼接结构

一种监测作物生长状况的农业装置

一种高弹性一体编织鞋面

奖励相关技术

线下支付返奖励的自动语音播报装置、系统和播报方法_北京今融道科技集团有限公司_202410394157.0

一种基于稀疏奖励环境强化学习探索的生产线决策方法_北京航空航天大学_202410435143.9

一种基于区块链的内容贡献奖励计数系统和方法_中铁十九局集团电务工程有限公司_202410447331.3

游戏赛事奖励数据结算方法及设备_成都完美天智游科技有限公司_202211617309.6

游戏的奖励发放方法、装置、存储介质及计算机设备_网易(杭州)网络有限公司_202110553146.9

一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法_山东科技大学_202410189981.2

训练奖励模型的方法、装置、设备和存储介质_北京百川智能科技有限公司_202311865743.0

逆向退回件业务员奖励截留方法及装置_上海东普信息科技有限公司_202410357644.X

面向无人船路径规划的深度强化学习奖励函数优化方法_大连海事大学_202010962958.4

基于智能合约众包结果评估与奖励分配方法和系统_北京航空航天大学_202111475201.3

移动相关技术

移动终端_青岛海信移动通信技术股份有限公司_201911368128.2

移动电站_米沃奇电动工具公司_202311810404.2

移动终端_OPPO广东移动通信有限公司_201980071279.3

标定工装、自主移动装置以及自主移动设备_库卡机器人(广东)有限公司_202323138784.8

移动工作机_利勃海尔液压挖掘机有限公司_202110351959.X

球形可移动设备_广东美的制冷设备有限公司_202211678784.4

移动电源车_长安绿电科技有限公司_202410696130.7

移动体系统_丰田自动车株式会社_202111464611.8

无管式移动空调_中山雅岚电器有限公司_202410431704.8

天线组件及移动终端_OPPO广东移动通信有限公司_202211678705.X

函数相关技术

基于新型颈网络和损失函数的小型船舶检测方法及系统_中国人民解放军海军潜艇学院_202410426660.X

确定函数分类的量子计算方法、量子线路、设备及介质_国开启科量子技术(安徽)有限公司_202410411280.9

一种基于改进PPR和扩张截止函数的组网群体发现方法_中国电子科技集团公司第十研究所_202210574621.5

基于推理参数的映射函数到视频信号的自动应用_微软技术许可有限责任公司_202410388467.1

一种基于等效电量函数法的弃风电量评估方法_国网甘肃省电力公司电力科学研究院_201911348244.8

一种气冷涡轮导向器流量函数试验件结构_中国航发沈阳发动机研究所_202410352155.5

QoS感知的CPU优化核粒度函数调度系统及方法_上海交通大学_202410447414.2

势函数的确定方法及装置、存储介质及电子装置_厦门大学_202410468288.9

可重构处理器及其上多种神经网络激活函数计算方法_清华大学_202011511272.X

一种基于焦点损失函数的知识图谱实体识别故障诊断分析方法_金川集团镍钴有限公司_202410379448.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于ε-UCB和栅格图奖励函数的移动机器人路径规划方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务