首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

清洁机器人路径规划方法、系统、计算机设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安交通大学

摘要:本发明属于人工智能和机器人路径规划领域,公开了一种清洁机器人路径规划方法、系统、计算机设备及存储介质,包括:获取各清洁机器人的垃圾仓容量和运行速度、机器人库的坐标以及各待清洁点的坐标、垃圾量和清洁工作量;根据各清洁机器人的垃圾仓容量和运行速度、机器人库的坐标以及各待清洁点的坐标、垃圾量和清洁工作量,调用预设的用于清洁机器人路径规划的深度强化学习模型,得到各清洁机器人的路径规划结果。可实现多清洁机器人的路径规划,可以求解存在多个机器人、大量待清洁点的清洁机器人路径规划问题,贴合实际应用场景,求得的路径规划方案优于传统优化方法,求解路径规划问题所需的运算时间远低于蚁群算法及动态规划算法等传统方法。

主权项:1.一种清洁机器人路径规划方法,其特征在于,包括:获取各清洁机器人的垃圾仓容量和运行速度、机器人库的坐标以及各待清洁点的坐标、垃圾量和清洁工作量;根据各清洁机器人的垃圾仓容量和运行速度、机器人库的坐标以及各待清洁点的坐标、垃圾量和清洁工作量,调用预设的用于清洁机器人路径规划的深度强化学习模型,得到各清洁机器人的路径规划结果;所述用于清洁机器人路径规划的深度强化学习模型通过如下方式构建得到:建立清洁机器人路径规划问题的数学模型;根据清洁机器人路径规划问题的数学模型,建立清洁机器人路径规划问题的马尔可夫决策过程模型;根据清洁机器人路径规划问题的马尔可夫决策过程模型,建立用于清洁机器人路径规划的初始深度强化学习模型;通过预设的训练集,训练用于清洁机器人路径规划的初始深度强化学习模型,得到用于清洁机器人路径规划的深度强化学习模型;所述清洁机器人路径规划问题的数学模型包括优化变量、优化目标和约束条件;其中,优化变量包括第一优化变量Y和第二优化变量Z: Z={zi,j|i∈P,j∈P}其中,P为机器人库和待清洁点构成的节点集合n为待清洁点的数量,p0表示机器人库节点;R为各清洁机器人构成的集合k为清洁机器人的数量,为指示变量,指示清洁机器人r是否从pi出发并抵达pj,若机器人r从pi出发并抵达pj,则否则zi,j为pi的坐标从xi运往pj的坐标xj的垃圾总量;优化目标如下式所示: 其中,cj是待清洁点pj的清洁工作量,c0=0;vr是清洁机器人r的运行速度;约束条件包括优化变量取值范围约束、区域访问次数约束、机器人路径连续性约束、机器人能携带的垃圾总量约束和垃圾运输约束;其中,优化变量的取值范围约束如下式所示: zi,j≥0,i∈P,j∈P区域访问次数约束如下式所示: 机器人路径连续性约束如下式所示: 机器人能携带的垃圾总量约束如下式所示: 其中,br是清洁机器人r的垃圾仓容量;垃圾运输约束如下式所示: 其中,P′=P-{p0},P′为由u个待清洁点构成的集合,gj是待清洁点pj的垃圾量,g0=0,M为预设常数;所述清洁机器人路径规划问题的马尔可夫决策过程模型包括环境状态、动作、状态转移规则以及代价;其中,环境状态St如下式所示: 其中,t为步数,为在第t步清洁机器人r垃圾仓的剩余容量,为在第t步清洁机器人r所在的节点,为截至第t步清洁机器人r访问过的节点构成的集合;为在第t步节点pi的访问状态,若节点pi已被访问过,则否则动作At如下式所示:At=dt,pt其中,dt为在第t步激活的节点解码器,pt∈P为在第t步选择的节点;状态转移规则ST用于根据动作At,通过下式将环境状态从St转移至St+1: 其中,rt是节点解码器dt对应的清洁机器人,表示将pt拼接在末端;代价F如下式所示: 其中,T是总步数,是清洁机器人r在第t步的代价,通过下式得到: 其中,表示和的距离,为pt的坐标,为的坐标;所述用于清洁机器人路径规划的深度强化学习模型包括:编码器和解码器;编码器包括节点编码器和机器人编码器,解码器包括解码器选择器和k个节点解码器;节点编码器和机器人编码器的输出端均与解码器选择器的输入端连接,解码器选择器的输出端与k个节点解码器的输入端均连接;节点编码器包括一个线性映射层和L1个图编码模块;线性映射层的输出端与第一个图编码模块的输入端连接;设为节点编码器的图编码模块的索引,当时,图编码模块的输出端与第个图编码模块的输入端连接,当时,图编码模块的输出端与解码器选择器的输入端连接;机器人编码器包括线性映射层和L2个图编码模块;线性映射层的输出端与第一个图编码模块的输入端连接;设为机器人编码器的图编码模块的索引,当时,图编码模块的输出端与第个图编码模块的输入端连接,当时,图编码模块的输出端与解码器选择器的输入端连接;解码器选择器包括多头注意力层和适应度层,多头注意力层的输出端与适应度层的输入端连接;节点解码器包括多头注意力层和适应度层,多头注意力层的输出端与适应度层的输入端连接。

全文数据:

权利要求:

百度查询: 西安交通大学 清洁机器人路径规划方法、系统、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。