【发明授权】基于行车风险分析的车辆强化学习运动规划方法_北京航空航天大学_202210336477.1

导航：龙图腾网> 最新专利技术> 基于行车风险分析的车辆强化学习运动规划方法_北京航空航天大学_202210336477.1

申请/专利权人：北京航空航天大学

申请日：2022-03-31

公开（公告）日：2024-06-21

公开（公告）号：CN114779764B

主分类号：G05D1/43

分类号：G05D1/43;G05D1/242;G05D1/243;G05D1/246;G05D1/65;G05D1/633;G05D1/644;G05D109/10

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2022.08.09#实质审查的生效;2022.07.22#公开

摘要：一种基于行车风险分析的车辆强化学习运动规划方法，包括：获取本车所在车道的两侧边界信息由车道两侧边界点横纵坐标Xr，Xl以及本车到左右两侧边界的垂直距离dl，dr组成；利用高精度地图和雷达获取状态信息数组由本车坐标位置X，Y、障碍物的坐标位置Xobs，Yobs和相对速度Δv组成；距离Δv＝[Δv1，Δv2，...，Δvn]，n是检测到的障碍物数量；将和组合成状态向量相对状态信息输入基于深度强化学习的车辆运动规划模型Φ，以输出本车动作向量action＝[a，θ]，其中a∈[‑amax，amax]是加速度动作，amax为最大加速度，θ∈[‑θmax，θmax]是方向盘转角动作，当θ∈[0，θmax]时为向左转动θ，当θ∈[‑θmax，0]时为向右转动θ；本车根据获取的action行驶t时长后，判断是否到达目的地，若是则结束工作状态，否则进入步骤1进行下一时间步长的车辆控制。

主权项：1.一种基于行车风险分析的车辆强化学习运动规划方法，其特征在于包括如下步骤：步骤1：利用视觉传感器获取本车所在车道的两侧边界信息该由车道两侧边界点横纵坐标Xr,Xl以及本车到左右两侧边界的垂直距离dl,dr组成，即利用高精度地图、激光雷达和毫米波雷达获取状态信息数组由本车坐标位置X,Y、周围环境障碍物的坐标位置Xobs,Yobs和相对速度Δv组成，即所述距离Δv＝[Δv1,Δv2,…,Δvn]，其中n是激光雷达和毫米波雷达在可检测范围内检测到的障碍物数量；步骤2：将车道边界信息和相对状态信息组合成状态向量相对状态信息并输入基于深度强化学习的车辆运动规划模型Φ中，以输出本车动作向量action，即action＝[a,θ]，其中a∈[-amax,amax]是加速度动作，amax表示最大加速度，θ∈[-θmax,θmax]是方向盘转角动作，当θ∈[0,θmax]时表示方向盘向左转动θ转角，当θ∈[-θmax,0]时表示方向盘向右转动θ转角；步骤3：本车根据步骤2获取的动作向量action行驶t时长后，判断是否到达目的地，若是，则结束工作状态，否则进入步骤1进行下一时间步长的车辆控制；所述步骤2中所述的车辆运动规划模型Φ是通过强化学习与环境交互训练获取的，且该训练包括如下步骤：步骤21：在深度学习环境中初始化车辆运动规划模型Φ的深度网络参数，并在车辆仿真环境中分别随机重置本车与障碍物的坐标位置和速度；其中障碍物包括行人、车辆、静止路障等，设置训练状态为done＝False；获取当前时刻t的车道边界信息和车辆与障碍物的状态信息步骤22：将车道边界信息和车辆与障碍物间的状态信息组合成状态向量并输入车辆运动规划模型Φ的深度网络中进行计算，获取当前时刻的动作向量actiont；步骤23：基于步骤22获取的动作向量actiont预测本车与周围车辆在未来时刻t+Δt的运动状态信息所述运动状态信息与上述的组成状态变量相同；然后针对运动状态信息计算获取相应的行车风险值步骤24：若其中GCollision指碰撞风险阈值，则将步骤2输出的动作actiont确定为碰撞风险动作，同时将动作向量actiont中的加速度动作at更换为最小加速度amin；若其中Gdangerous为危险风险阈值，则将动作actiont确定为危险风险动作，并按照相对运动状态对加速度动作at进行安全补偿，即将加速度动作at更改为其中为安全补偿值，ε为安全补偿系数，同样若则确定输出的动作actiont为普通风险动作，同时保持步骤2获取的动作向量actiont不变；步骤25：本车按照步骤24输出的动作actiont行驶Δt时长后，输出t+Δt时刻的车道边界信息和相对状态信息并组合成状态向量步骤26：同时根据中的判断本车与障碍物是否发生碰撞或者t+Δt是否满足t+Δt≥T，其中T指每回合的最大训练时长，如果是，则将训练状态更改为done＝True，否则，保持done＝False；步骤27：将状态向量输入奖励函数中获取此时的奖励值同时将作为一个样本存储至经验池中；步骤28：若经验池中的样本量大于N，则从经验池中随机筛选n个样本对模型Φ中的深度网络参数进行梯度优化；步骤29：若done＝True，则结束本回合训练，同时判断此时的训练回合数是否达到了最大回合数，如果没有，则进入步骤21开始下一回合训练，否则结束训练；若done＝False，令t＝t+Δt，进入步骤22开始下一步长的训练。

全文数据：

权利要求：

百度查询：北京航空航天大学基于行车风险分析的车辆强化学习运动规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于遥测信号辅助的干涉测量带宽综合方法_北京航天飞行控制中心_202410175613.2

下一篇：车辆控制装置、车辆控制方法以及非暂时性存储介质_丰田自动车株式会社_202311560781.5

相关技术

一种基于遥测信号辅助的干涉测量带宽综合方法_北京航天飞行控制中心_202410175613.2

车辆控制装置、车辆控制方法以及非暂时性存储介质_丰田自动车株式会社_202311560781.5

一种倾斜电路板焊点视觉反馈高精度点触方法_清华大学天津高端装备研究院_202410068626.X

一种电磁炉陶瓷凹盘及其制备方法_佛山市越富炉具实业有限公司_202410294934.4

一种智能拍背装置_中日友好医院(中日友好临床医学研究所)_202410324763.5

一种通过拖拽组件布局页面的方法_深圳市禾望电气股份有限公司_202410181714.0

水处理机和用于水处理机的控制阀_余姚市亚东塑业有限公司_202311753429.3

由独立组分生产的果仁酱仿品_航行食品股份有限公司_202280059657.8

密封结构、储能柜以及储能系统_比亚迪股份有限公司_202311864539.7

一种硅光器件及制造方法_上海集成电路研发中心有限公司_202211648345.9

图像解码方法及其装置_LG电子株式会社_202280076929.5

针对根据亮度预测色度的预测选择下采样滤波器_腾讯美国有限责任公司_202280075374.2

学习相关技术

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种基于多层次增强对比学习的慕课学习者学习成效预测方法_华中师范大学_202410337219.4

基于补丁匹配度量的语义交互元学习网络及学习方法_西北工业大学_202410198101.8

一种基于智能学习机的学习进度自适应跟进系统_山东金声教育科技有限公司_202410387512.1

一种基于课程学习的图像分类的增量学习方法_西北工业大学_202410254888.5

一种英语学习助记器_盐城师范学院_202322721576.4

综合思维能力学习装置_可丽普株式会社_202110859201.7

一种学习机_深圳市锐族数码科技有限公司_202322594024.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种新型学习教具_青岛滨海学院_202322503391.6

强化相关技术

锂铝硅酸盐玻璃的强化方法、强化玻璃及其应用_咸宁南玻光电玻璃有限公司_202410019601.0

玻璃的强化方法、强化玻璃和可折叠电子设备_深圳市锐尔觅移动通信有限公司_202211652048.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种强化传热石墨换热器_淄博华鸣新材料有限公司_202321631528.X

强化烘干多段焙烧炉_中际山河科技有限责任公司_202322259939.7

强化的电池热屏障和方法_亚斯朋空气凝胶公司_202311767179.9

一种高强化发动机活塞_瑞安市程泰活塞制造有限公司_202322999464.5

一种方便拆卸组装的强化传热管_山东交通学院_202410414528.7

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种表面急冷强化除雾装置_潜江宜生新材料有限公司_202322840726.3

车辆相关技术

车辆驱动系统及车辆_重庆赛力斯新能源汽车设计院有限公司_202323436010.3

车辆制动系统以及车辆_比亚迪股份有限公司_202311750530.3

车辆_丰田自动车株式会社_202110764981.7

车辆_本田技研工业株式会社_202323153060.0

车辆_比亚迪股份有限公司_202311427648.2

车辆_丰田自动车株式会社_202311589150.6

车辆扣手机构及车辆_宜宾凯翼汽车有限公司_202011096514.3

座椅调角器、车辆座椅和车辆_比亚迪股份有限公司_202311137670.3

车辆控制方法、装置、设备及车辆_上海集度汽车有限公司_202211651218.4

车辆的置物组件以及车辆_浙江吉利控股集团有限公司_202323352583.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于行车风险分析的车辆强化学习运动规划方法_北京航空航天大学_202210336477.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务