Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京邮电大学赵东获国家专利权

北京邮电大学赵东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京邮电大学申请的专利一种面向多样化动态信号灯模式的车速推荐方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116259175B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211719951.5,技术领域涉及:G08G1/01;该发明授权一种面向多样化动态信号灯模式的车速推荐方法及装置是由赵东;马华东;朱波青;丁立戈;王兆丰设计研发完成,并于2022-12-30向国家知识产权局提交的专利申请。

一种面向多样化动态信号灯模式的车速推荐方法及装置在说明书摘要公布了:本发明公开了一种面向多样化动态信号灯模式的车速推荐方法及装置,首先根据邻接路口及自身路口的交通状况,利用相位感知注意力机制推测几秒后本路口各个车道的车辆数占比;然后根据前K个时间段的本路口各个车道的车辆数占比和推测的几秒后本路口各个车道的车辆数占比,利用模仿学习来近似估计信号灯的最优偏好,利用LSTM模型推测接下来一段时间的信号灯相位变化序列;最后根据预测的信号灯相位变化序列,结合多种传感器获取的交通状况,利用策略梯度强化学习的方法给出在多维数据影响下的对多个目标进行优化的绿灯最优速度。本发明可应用于城市道路的任意场景,且推荐速度为多目标最优速度,保证绿灯最优速度推荐算法的安全性、高效性和省时特性。

本发明授权一种面向多样化动态信号灯模式的车速推荐方法及装置在权利要求书中公布了:1.一种面向多样化动态信号灯模式的车速推荐方法,其特征在于,包括以下步骤: S1、根据邻接路口及自身路口的交通状况,利用相位感知注意力机制推测几秒后本路口各个车道的车辆数占比; 步骤S1的具体过程为: S11、将本路口及其邻接路口的状态信息输入到全连接网络中提取出隐藏特征Hj;状态信息包括每个驶入车道的等待车辆数和当前信号灯相位; S12、计算出相位感知注意力分数αji: 其中rji是相位感知注意力分数的相关系数,计算公式如下: 其中,连通与非连通表示从Ij到Ii由于信号灯的影响是否可通行,p为超参数,用来平衡不同路口对本路口之间的影响,设置数值为0.5;为本路口Ii的所有邻接路口到本路口的通行时间的平均值, 表示与本路口Ii在地理上有邻接关系的路口集合;Tji为邻接路口Ij到本路口Ii的平均通行时间,通过邻接路口Ij和本路口Ii之间的距离和平均行驶速度计算出; S13、将每个路口的隐藏特征Hj和相应的相位感知注意力分数αji进行结合: 其中Wq、Wc为权重矩阵,bq为偏差向量; S14、利用全连接网络得到最终的本路口每个驶入车道的车辆数占比 S2、根据前K个时间段的本路口各个车道的车辆数占比和推测的几秒后本路口各个车道的车辆数占比,利用模仿学习来近似估计信号灯的最优偏好,利用LSTM模型推测接下来一段时间的信号灯相位变化序列; 步骤S2的具体过程为: S21、以n秒为时间间隔,输出t′秒后的信号灯预测相位序列 S22、对每个预测值单独训练,每个训练模型得出本路口Ii每个信号灯相位的概率分布最终信号灯预测相位为: S23、经由一层LSTM网络和两层全连接网络,最终的激活函数为softmax函数,得出每个信号灯相位的概率分布; S3、根据预测的信号灯相位变化序列,结合多种传感器获取的交通状况,利用策略梯度强化学习的方法给出在多维数据影响下的对多个目标进行优化的绿灯最优速度; 步骤S3中的多种传感器包括: 部署在车辆保险杠前端的毫米波雷达和部署在车内用于连接毫米波雷达的蓝牙转换器,用于持续监测与前方车辆的相对位置和相对速度; 驾驶员手机中的GPS和加速计,用于实时获取车辆自身的位置信息和速度; 以及道路基础设施的摄像头,用于捕获全局交通状况。 步骤S3中获取的交通状况包括局部信息和全局信息局部信息包括:车辆速度vt、与前方车辆的相对速度Δvt和相对距离Δst;全局信息包括当前位置距离前方信号灯的距离dt和预计到达时间ΔTt,以及信号灯预测相位序列 步骤S3对多个目标进行优化,包括从车辆的旅行时间、安全性和绿灯通过率三个方面进行了奖励函数的设置,其中: 车辆的旅行时间的奖励函数设置公式如下: 其中,vmax表示城市道路中的限速,即允许行驶的最大速度;vt表示当前时刻车辆自身速度值,k是该公式中的超参数,使得kvt的最大值为1; 采用碰撞时间来衡量潜在危险行为的发生概率,安全性奖励函数设置公式如下: 其中,η是该公式中的超参数,意为安全距离,被设置为0.8; 车辆的绿灯通过率的奖励函数为R3,根据车辆通过路口的预测时间和预测相位来计算车辆是否在未来为绿灯通行,绿灯时为1,否则为-1; 最终的奖励函数为R=R1+R2+R3; 步骤S3的策略梯度强化学习模型训练过程采用贝尔曼方程得到最优累计折扣奖励值; 步骤S3的策略梯度强化学习模型训练过程为:将状态St,动作at,奖励rt以及下一个时间步的状态St+1以元组形式[St,at,rt,St+1]存储到记忆池中,每次随机抽取一批数据进行训练,actor网络的梯度更新方向为提升其优势值,损失函数为: 其中,为actor行为网络pθs,a和actor目标网络p′θs,a之间的比值,使用clip函数将更新幅度限制在[1-ε,1+ε]之间,其中的优势值为: 其中,γ表示折扣值,和分别为critic行为网络和critic策略网络的价值函数值,critic网络的损失函数为:

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。