一种大模型驱动的具身智能体零样本目标导航方法

导航：龙图腾网> 最新专利技术> 一种大模型驱动的具身智能体零样本目标导航方法

申请/专利权人：西安交通大学

申请日：2024-03-05

公开（公告）日：2024-06-28

公开（公告）号：CN118258396A

主分类号：G01C21/20

分类号：G01C21/20

优先权：

专利状态码：在审-公开

法律状态：2024.06.28#公开

摘要：本发明公开了一种大模型驱动的具身智能体零样本目标导航方法，包括：首先，具身智能体通过旋转拍摄来获取场景的彩色和深度图像；使用YOLOv7和DETR模型处理彩色图像以识别物体标签，同时运用LLaVA和CLIP模型对图像生成字幕，描述场景内容。这些信息作为导航的场景线索；基于这些线索，通过LLaMA和GPT‑4模型推理并决定智能体的导航过渡点；在Gazebo仿真平台上，利用gmapping和hector_slam工具进行路径规划，构建导航代价图，使智能体能够避开障碍物。智能体到达新的导航过渡点后，使用GLIP和InstructDET模型进行开放语义目标定位；如果目标定位准确度达到预设阈值，将触发目标导航成功信号；否则，智能体将继续推理下一步导航过渡点，并重复该流程直至导航成功或失败。

主权项：1.一种大模型驱动的具身智能体零样本目标导航方法，其特征在于，包括以下步骤：步骤一、基于智能体传感器的环境感知：智能体在当前位置旋转一周，并通过视频拍摄传感器拍摄场景的多张不重复彩色图像和深度图像；步骤二、多模态大模型驱动的场景线索获取：利用目标检测视觉大模型处理彩色图像，获得场景中的物体标签；同时，通过字幕生成大模型对彩色图像进行字幕输出，获得该场景主题介绍，物体标签和主题介绍同时作为场景线索；其中，用于目标检测的视觉大模型为YOLOv7和DETR，用于图像的字幕生成大模型为LLaVA和CLIP；步骤三、大语言模型驱动的导航推理决策：基于场景线索，通过自适应提示文本模板构造大语言模型的输入，大语言模型推理并反馈其指导建议，即所述场景线索中的具体物体，作为该智能体后续导航过渡点；步骤四、基于Gazebo仿真平台的ROS路径规划：在Gazebo仿真平台上，基于步骤一获取的深度图像，利用SLAM仿真工具gmapping和hector_slam构建导航代价图，并将步骤三获取的导航过渡点映射至该导航代价图，控制智能体朝代价图上过渡点对应的方向行进；步骤五、基于视觉大模型的开放语义目标定位：待智能体到达新导航过渡点，重复旋转一周并拍摄周围彩色图像，通过视觉大模型GLIP和InstructDET对图像进行开放语义目标定位，当目标对象定位的准确性超过预设阅值，则触发目标导航成功信号，否则，智能体推理下一步导航过渡点并行进，循环该流程直至导航成功或者超过最大循环步即导航失败。

全文数据：

权利要求：

百度查询：西安交通大学一种大模型驱动的具身智能体零样本目标导航方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种生态护坡绿化模块

下一篇：一种纸尿裤生产用包边机

相关技术

一种生态护坡绿化模块

一种纸尿裤生产用包边机

一种杀菌效果好的卤制品杀菌锅

一种预应力钢绞线辅助穿束防缠绕工具

一种自动开盖的压力烹饪器具

一种宽度紧凑型半导体封装结构

一种配电网规划用的智慧配电网架

一种叠加机

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

一种泡菜水检测用的取样装置

一种上颌窦膜推起工具

一种仓库物资搬运装置

体相关技术

层叠体_东洋纺株式会社_202080043320.9

片材集合包装体和片材包装体_大王制纸株式会社_202311718871.2

容器前体_康美包(苏州)有限公司_202211635494.1

牙植入体_登蒂普乐股份有限公司_202280076671.9

轮胎组装体_住友橡胶工业株式会社_202311609144.2

肱骨假体_北京爱康宜诚医疗器材有限公司_202010575937.7

轮胎组装体_住友橡胶工业株式会社_202311622257.6

反射型显示体_琳得科株式会社_202011407252.8

多盒体_亚历山大·尼古拉耶维奇·印丁科_202180103930.8

建材板体连接组件_国山石材企业有限公司_202311198000.2

智能相关技术

智能家居控制方法、系统及其智能终端、智能子设备_深圳拓邦股份有限公司_202110826249.8

智能门锁的控制方法及智能门锁_青岛海信智慧生活科技股份有限公司_202211673479.6

立式智能泵_青岛三利泵业有限公司_202211672398.4

智能马桶水箱结构_余姚市美格卫浴工业有限公司_202322642468.8

智能NIC的成组_威睿有限责任公司_202280076727.0

智能文件柜_深圳市蓄腾科技有限公司_202322180533.X

智能电动洗耳器_澳迈迪科技(东莞)有限公司_202322214753.X

智能轨道小车_艾信智慧医疗科技发展(苏州)有限公司_202410219184.4

智能摄像头_重庆晶实佳塑胶模具有限公司_202322194066.6

一种智能蜂箱_西安学超商贸有限公司_202322995359.4

身相关技术

一种CMC涡轮转子叶片叶身模拟件设计方法_南京航空航天大学_202410254462.X

一种基于具身智能的无人机目标追踪方法_南京航空航天大学_202410308765.5

一种大模型驱动的具身智能体零样本目标导航方法_西安交通大学_202410249695.0

一种海绵钛包装桶桶身与桶盖的密封装置_遵义钛业股份有限公司_202323314184.2

一种装配式坝身钢筋混凝土面层结构_华电重工股份有限公司_202322987592.8

食品罐罐身多工序复合成型模具_东莞市铁生辉制罐有限公司_201910604896.7

一种大型电力变压器器身用的垫脚定位装置_中电电气(江苏)变压器制造有限公司_202323068917.9

一种带有定心修正的身管内膛检测装置_中国人民解放军陆军工程大学_202410369536.4

一种桩身扩径多功能双动力钻具及型桩_河北锥基土木工程有限公司_202322415691.9

一种具身智能推土机器人自主施工方法及系统_华中科技大学_202410667456.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种大模型驱动的具身智能体零样本目标导航方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务