首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度强化学习的地铁纵断面线路节能设计寻优方法_西南交通大学_202311330407.6 

申请/专利权人:西南交通大学

申请日:2023-10-16

公开(公告)日:2024-06-18

公开(公告)号:CN117521485B

主分类号:G06F30/27

分类号:G06F30/27;G06N3/04;G06N3/08;G06N3/006;G06F111/04

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本发明涉及地铁纵断面线路设计技术领域,涉及一种基于深度强化学习的地铁纵断面线路节能设计寻优方法,其包括以下步骤:一、结合地铁线路设计规范约束与实际施工条件约束,建立以列车运行能耗最小为目标的地铁纵断面线路设计模型;二、采用深度强化学习算法求解不同运行能耗计算因子下的地铁纵断面最优节能线路。本发明相较于实际纵断面线路设计方案可同时降低列车运行能耗成本和时间成本。

主权项:1.基于深度强化学习的地铁纵断面线路节能设计寻优方法,其特征在于:包括以下步骤:一、结合地铁线路设计规范约束与实际施工条件约束,建立以列车运行能耗最小为目标的地铁纵断面线路设计模型;二、采用深度强化学习算法求解不同运行能耗计算因子下的地铁纵断面最优节能线路;地铁纵断面线路设计模型包括:1环境Environment:避让区和平面线路缓和曲线段区域构成了地铁纵断面线路优化的环境;2代理Agent:被定义为决定纵断面线路节能设计走向的智能程序;3状态State:变坡点的空间位置被定义为状态si,空间位置指的是地铁纵断面二维坐标包括纵向里程坐标与垂向深度坐标;4动作Action:被代理选择的下一个变坡点的搜索方向被定义为动作ai;5奖励Reward:奖励的数值取决于环境的反馈,以列车运行能耗作为奖励的主要构成部分,其他构成部分为生存状态奖励与目标距离奖励;6条件Condition:如果agent无法找到满足从状态si到si+1所有约束条件的动作ai,即当前状态变化条件ci不成立conditionci=false,并将当前状态si初始化状态为s0;反之状态变化条件ci成立conditionci=true,继续下一个动作的选择;地铁线路设计规范约束与实际施工条件约束包括:1车站区域坡段坡长和坡度约束在车站区域仅设置一个坡段,即进站、出站坡段长度之和大于站台长度Lst,假设进、出站坡段长度相同,则车站区域坡长li约束表示为:li≥Lst2i=1,N+1车站坡度αi使用给定常数Ast,即:αi∈Asti=1,N+12非车站区域坡段坡长和坡度约束非车站区域坡段坡长约束表示为:lmin≤li≤lmaxi=2,3,…,N线路设有最小坡度αmin和最大坡度αmax,即:αmin≤|αi|≤αmaxi=2,3,…,N3最小夹直线长度两相邻竖曲线之间的夹直线长度Lj应满足设计规范要求,计算公式如下:Lj=xi-xi-1-Ti+Ti-1≥Ljmin式中,xi表示第i个变坡点的纵向里程;Ti表示第i个变坡点处的切线长;Ljmin表示设计规范中最小夹直线长度;4反向限制坡度两相反方向的坡段连接时,其中一个方向的坡度αi-1ori不应大于反向限制坡度αreverse,即:|αi-1ori|≤αreverseifαi-1×αi05线路埋深约束线路埋深约束是,线路上任意一点n所在的地下隧道的轨顶设计高程应小于该点所在的地面高程减去隧道高度Hc以及最小覆土厚度Hs,即: 6避让区域约束地铁纵断面所有避让区域用UF表示,地铁纵断面线路隧道区域用LR表示,UF和LR的交集应该为空集: 7平面缓和曲线段约束变坡点里程坐标与平面缓和曲线起终点里程坐标的距离不应小于竖曲线的切线长,即:

全文数据:

权利要求:

百度查询: 西南交通大学 基于深度强化学习的地铁纵断面线路节能设计寻优方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。