首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度强化学习的火灾现场逃生-救援联合系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏科技大学苏州理工学院

摘要:本发明公开一种基于深度强化学习的火灾现场逃生‑救援联合系统,该系统包括设置在消防安全重点单位消火栓箱附近的逃生衣和设置在消防救援车上的消防控制室;所述逃生衣设有在恶劣环境下与外界通讯的低功耗无线信号传输模块,并植入建筑物逃生路线图、室内定位系统和基于Q‑learning强化学习逃生路径规划算法;所述消防控制室设有信息接收模块和基于实时火情和LSTM的逃生路径引导算法;一旦发生火情,现场人员拿起逃生衣产生快速移动时,逃生衣的线信号传输模块自动启动引导人员疏散,并与消防控制室和消防救援车进行实时通信,实现火灾现场自救和消防救援人员搜救相结合,有效的提高生还率,最大程度上减轻火灾现场人员的受害程度。

主权项:1.一种基于深度强化学习的火灾现场逃生-救援联合系统,其特征在于:包括逃生衣和设置在消防救援车上的消防控制室;所述逃生衣设有用于与外界通讯的无线信号传输模块,并植入建筑物逃生路线图、室内定位系统和基于Q-learning强化学习逃生路径规划算法;所述消防控制室设有信息接收模块,并植入基于实时火情和LSTM的逃生路径引导算法;发生火情,现场人员拿起逃生衣产生快速移动时,逃生衣的无线信号传输模块自动启动引导人员疏散,并与消防控制室进行实时通信;所述基于Q-learning强化学习逃生路径规划算法,用于实现基于火灾环境下进行路径规划的强化学习系统,该系统输入的是火灾初始位置参数,输出的是抢救矩阵;所述基于火灾环境下进行路径规划的强化学习系统,其设计时将建筑物的环境信息分为内部环境信息和外部环境信息,所述内部环境信息是建筑物的每层楼的环境信息,所述外部环境信息是设置合适的奖惩制度;该基于火灾环境下进行路径规划的强化学习系统,实现过程如下:1)首先获得发生火灾的建筑物的外部环境信息;2)将外部环境信息和内部环境信息均传递到所述基于Q-learning强化学习逃生路径规划算法中,形成环境信息观察结论;3)将环境信息观察结论移交给情感系统进行分析,继而将分析结果解析为结果建议,并反馈到强化学习系统的策略选择算法中,从而得到最佳路径策略;所述基于实时火情和LSTM的逃生路径引导算法,为通过固定的先验内容实现,其构建算法的寻路步骤是:S1.将起始点O存入开启列表,等待系统检查,所用点位的数据形成数据库,并且作为先验的结果进行存储;S2.探索点O周围能够抵达的点Q,把Q点放到开启列表中,并将点O命为母点;S3.在开启列表中找到点O并转移到已走列表当中;S4.在点Q周围寻找该点所有能够抵达的点R:若点R在安全列表中,则下一步是通过计算比较是否经过R点的两种情况下所产生的代价,根据代价大小判断是否经过R点;S5.重复步骤S2~S4直至寻到目标点P,该目标点为动态点,在动态点位设计中,所有的出口点位都设置在了一楼,即只能通过将路径规划到一楼的方式来进行逃生;所述基于火灾环境下进行路径规划的强化学习系统,将建筑物的每一个区域抽象为一个状态,将选择进入的区域作为动作,把状态图和立刻奖励值整理成回报矩阵,Agent的目的为达到奖励值最高的状态;所述基于火灾环境下进行路径规划的强化学习系统,在得到回报矩阵后,在Agent的大脑中加入一个类似的矩阵Q,作为奖励值参考表;矩阵的行代表Agent目前所在的区域,列代表Agent下一步选择进入的区域;当区域之间的通道情况随火势蔓延改变时,改变相应的奖励值进行更新矩阵Q;所述矩阵Q的训练过程如下:(1)对建筑环境和各参数进行初始化;所述参数包括最大训练周期数、火灾初始位置参数γ、即时回报函数R和评估矩阵Q;(2)任意选出一个初始状态s,若s=s*,则周期结束,重新选择新的开始状态;(3)在当前状态s下的全部可能动作中随机选取一个动作a,而且每一个动作被选择的可能性相同;(4)在当前状态s下选取动作a后进入下一个状态s’;(5)使用Q学习的更新规则公式更新矩阵Q;(6)设置下一状态为当前状态,s=s’,若s没有获得目标状态,则转到步骤3;(7)假如算法没有达到最大训练周期数,则跳转到步骤2重新选择状态进入下一周期,否则结束训练,得到训练成功的具有收敛性的矩阵Q;所述矩阵Q的训练还包括在PyCharm中利用Python语言对Agent进行训练;训练时,设置火灾初始位置参数γ,其范围是0到0.9;通过输入不同的参数γ值,来代表各层救援人员与楼层火灾初始位置之间的远近关系;所述基于实时火情和LSTM的逃生路径引导算法,还包括火灾救援判定程序,其通过直接输入给定范围内的数字来判定依据历史数据库能否抢救成功,快速地进行最佳路径规划。

全文数据:

权利要求:

百度查询: 江苏科技大学苏州理工学院 一种基于深度强化学习的火灾现场逃生-救援联合系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术