基于多元文本的人物交互检测方法、终端及可读存储介质

导航：龙图腾网> 最新专利技术> 基于多元文本的人物交互检测方法、终端及可读存储介质

申请/专利权人：哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

申请日：2024-03-26

公开（公告）日：2024-06-25

公开（公告）号：CN117953543B

主分类号：G06V40/10

分类号：G06V40/10;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06V10/26

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2024.05.17#实质审查的生效;2024.04.30#公开

摘要：本发明公开基于多元文本的人物交互检测方法、终端及可读存储介质，所述方法包括：获取原始待检测图像，根据所述原始待检测图像获取所述原始待检测图像中的人目标和物目标的多角度交互特征；获取先验文本的先验文本特征，将所述多角度交互特征和所述先验文本特征进行双向特征融合，得到融合图像特征和融合文本特征；根据所述多角度交互特征、所述融合图像特征和所述融合文本特征，输出人目标和物目标的交互动作预测结果。可以看出，本发明通过多元化文本的交叉对照，从而避免了单个文本作为先验信息时，会引入有歧义性的先验文本特征，进而影响模型预测的准确性和鲁棒性的问题，从而提高了模型整体预测的准确性和鲁棒性。

主权项：1.一种基于多元文本的人物交互检测方法，其特征在于，所述基于多元文本的人物交互检测方法包括：获取原始待检测图像，根据所述原始待检测图像获取所述原始待检测图像中的人目标和物目标的多角度交互特征；所述根据所述原始待检测图像获取所述原始待检测图像中的人目标和物目标的多角度交互特征，具体包括：对所述原始待检测图像进行目标定位，获取所述原始待检测图像中的人目标位置和物目标位置；将所述原始待检测图像、所述人目标位置和所述物目标位置输入多角度图像特征提取模块，通过所述多角度图像特征提取模块提取并输出所述多角度交互特征；获取先验文本的先验文本特征，将所述多角度交互特征和所述先验文本特征进行双向特征融合，得到融合图像特征和融合文本特征；根据所述多角度交互特征、所述融合图像特征和所述融合文本特征，输出人目标和物目标的交互动作预测结果；所述多角度图像特征提取模块包括实例感知分支、交互感知分支、背景感知分支、第一多层感知机和线性层；所述通过所述多角度图像特征提取模块提取并输出所述多角度交互特征，具体包括：通过所述实例感知分支根据所述原始待检测图像、所述人目标位置和所述物目标位置提取人实例特征和物实例特征；通过所述交互感知分支根据所述人目标位置和所述物目标位置的图像提取人和物的交互关系特征；通过所述背景感知分支根据所述原始待检测图像提取交互背景特征；通过所述第一多层感知机对所述人实例特征、所述物实例特征、所述交互关系特征和所述交互背景特征进行融合，得到局部图像特征；通过所述线性层对局部图像特征进行处理得到全局层次图像特征；将所述局部图像特征和所述全局层次图像特征作为所述多角度交互特征；所述将所述多角度交互特征和所述先验文本特征进行双向特征融合，得到融合图像特征和融合文本特征，具体包括：采用Transformer解码器，以所述多角度交互特征作为查询，所述先验文本特征作为键值和属性值，计算得到所述融合图像特征：；其中，表示融合图像特征，表示转置，是激活函数，为局部图像特征，为先验文本特征，代表和中特征向量的长度；采用Transformer解码器，以所述先验文本特征作为查询，所述多角度交互特征作为键值和属性值，计算得到所述融合文本特征：；其中，表示融合文本特征；所述根据所述多角度交互特征、所述融合图像特征和所述融合文本特征，输出人目标和物目标的交互动作预测结果，具体包括：采用第二多层感知机对所述多角度交互特征进行映射，得到全局人物交互的映射查询；将所述融合图像特征和所述融合文本特征进行拼接，得到拼接特征；采用人物交互解码器以所述映射查询作为查询，以所述拼接特征作为键值和属性值，解码出人目标和物目标的所述交互动作预测结果。

全文数据：

权利要求：

百度查询：哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于多元文本的人物交互检测方法、终端及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种杀菌效果好的卤制品杀菌锅

下一篇：一种螺旋输送装置

相关技术

一种杀菌效果好的卤制品杀菌锅

一种螺旋输送装置

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

气动搬运平台

生产混凝土用碎石仓

一种实时监测并控制化锡线硫化氢气体的装置

一种液体沥青取样装置

一种薄荷醇制取用原料粉碎装置

一种NB模组驱动的摄像采集装置

电芯和电子设备

一种宽度紧凑型半导体封装结构

一种公共卫生用预防传染病喷雾装置

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

片间通信方法_中科寒武纪科技股份有限公司_202211681198.5

终端相关技术

移动终端_OPPO广东移动通信有限公司_201980071279.3

移动终端_青岛海信移动通信技术股份有限公司_201911368128.2

终端装置_丰田自动车株式会社_202311807753.9

终端装置_丰田自动车株式会社_202311819465.5

机械臂遥控终端_中海辉固地学服务(深圳)有限公司_202322798820.7

天线结构及终端_北京小米移动软件有限公司_202211714882.9

一种移动终端_北京小米移动软件有限公司_202211690292.7

测量调整方法和终端_维沃移动通信有限公司_202011193863.7

一种终端天线_荣耀终端有限公司_202211676195.2

天线组件及移动终端_OPPO广东移动通信有限公司_202211678705.X

检测相关技术

检测电路_三菱电机株式会社_202180104361.9

检测装置_镭神技术(深圳)有限公司_202322952624.0

一种检测晶体管漏源电流的检测器件、检测方法及电流检测电路_苏州晓玮科技有限公司_202410640212.X

用于检测隔膜漏气的检测器、调节阀装置和检测方法_中广核核电运营有限公司_202410306571.1

用于检测硅片位置的检测装置、硅片处理系统及检测方法_深圳市捷佳伟创新能源装备股份有限公司_201810799161.X

一种工程检测用桩基检测装置及检测方法_四川文茂建设工程检测有限公司_202410675186.4

具有流量分级检测的漏水检测装置_瑞纳智能设备股份有限公司_201810721597.7

一种环境检测用土壤检测装置_山东华正检测有限公司_202410693304.4

水相溶液质量在线检测系统及检测方法_陕西北方民爆集团有限公司_202410335917.0

样品检测装置及样品检测方法_韩国电子通信研究院_202311545558.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多元文本的人物交互检测方法、终端及可读存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务