基于多模态大模型的家庭健康服务机器人及智能交互方法

导航：龙图腾网> 最新专利技术> 基于多模态大模型的家庭健康服务机器人及智能交互方法

申请/专利权人：湖南超能机器人技术有限公司

申请日：2024-04-11

公开（公告）日：2024-06-28

公开（公告）号：CN118039057B

主分类号：G16H15/00

分类号：G16H15/00;G06N3/0464;G16H50/20;G16H50/70

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2024.05.31#实质审查的生效;2024.05.14#公开

摘要：本申请涉及一种基于多模态大模型的家庭健康服务机器人及智能交互方法，该方法构建了VLM架构的智能交互模型；该模型采用了新型图像编码器和微调版大模型；将获取的面部舌部图像输入到图像编码器中进行编码，将图像编码特征和一组可学习查询项输入到微调版查询Transformer结构中，得到类文本特征，将类文本特征和对应标注文本数据输入到微调版输入适配器中，得到视觉诊断结果；将所述视觉诊断结果、人体体征数据以及预定提示输入到微调后的LLM中，生成用户健康报告。本方法可实现多模态数据交互，输出准确可靠，易于使用，可应用于家庭健康服务机器人，实现基于多模态大模型的人机智能交互，初步达成服务机器人具身智能。

主权项：1.一种基于多模态大模型的智能交互方法，其特征在于，所述方法适用于基于家庭健康服务机器人的人机交互；所述方法包括：构建基于多模态大模型的智能交互模型；所述智能交互模型包括预训练的LLM、图像-文本对齐模块；所述图像-文本对齐模块包括预训练的图像编码器、查询Transformer结构以及输入适配器；所述图像编码器用于通过在经典残差卷积网络组件中引入自注意力模块，对输入的图像进行编码；采用获取的中文医疗问答数据集，对LLM进行微调；冻结所述图像编码器和微调后的LLM的模型参数，对所述智能交互模型中的所述查询Transformer结构和所述输入适配器进行微调；获取面部和舌部图像和对应的标注文本数据；将所述面部和舌部图像输入到所述图像编码器中，得到图像编码特征，将所述图像编码特征和一组可学习查询项输入到微调后的查询Transformer结构中，得到类文本特征，将所述类文本特征和对应的所述标注文本数据输入到微调后的输入适配器中，得到视觉诊断结果；将所述视觉诊断结果、家庭健康服务机器人获取的人体体征数据以及预定提示输入到微调后的LLM中，生成用户健康报告。

全文数据：

权利要求：

百度查询：湖南超能机器人技术有限公司基于多模态大模型的家庭健康服务机器人及智能交互方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种无纺布绑袋

下一篇：一种便于移动的展开式箱房

相关技术

一种无纺布绑袋

一种便于移动的展开式箱房

一种可控制持握角度的羽毛球拍

一种升降式饺子加工压面机

一种移动式自填充胶枪

一种可快速拼接的安装架

一种用于治疗小儿肌性斜颈的固定器

一种具有分级过滤功能的纳滤膜元件

一种钻机润滑专用压缩机

一种互动茶几安全防护围挡

一种建筑施工用抹灰装置

一种土工格栅注塑模具

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多模态大模型的家庭健康服务机器人及智能交互方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务