首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于TED-Net的非接触人-物交互检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南理工大学

摘要:本发明公开了一种基于TED‑Net的非接触人‑物交互检测方法,包括以下步骤:对输入图像进行数据增强;通过卷积神经网络进行视觉特征提取,获取人‑物视觉特征;通过图像压缩技术获取特征图的压缩特征;获取基于编码器的全局特征编码;通过公共的查询矩阵获取三个查询向量分别表示人、物、交互关系,引入配对信息;融合编码后的特征构建三流解码器获取人的位置信息、物的位置信息及物体类别、交互类别,实现人物交互检测。本发明利用人‑物细粒度特征关注人‑物周围环境提供的有效信息,捕获非接触交互信息,在人物交互检测问题上,进一步提高了人物交互检测的精度。

主权项:1.一种基于TED-Net的非接触人-物交互检测方法,其特征是,包括以下步骤:a、对输入的人物交互图像进行数据增强;b、将数据增强后的图像输入到卷积神经网络中,通过卷积神经网络进行视觉特征提取,获取人-物视觉特征;c、通过图像压缩将人-物视觉特征进行压缩获取特征图的压缩特征;d、通过编码器对压缩后的特征图进一步编码,获取基于编码器的全局特征编码;编码器Encoder包括N个子编码器层堆叠而成,每个子编码器层分别包括两个子层,第一个子层包括多头注意力层和规范化层,第二个子层包括前馈神经网络层和规范化层;e、通过查询矩阵获取三个查询向量分别表示人、物、交互关系,引入配对信息;f、融合编码后的特征构建三流解码器获取人的位置信息、物的位置信息及物体类别、交互类别,实现人物交互检测;所述的三流解码器包括交互解码器和采用DispersalDecoder架构的人物分散解码器、物体分散解码器,其中人物分散解码器与物体分散解码器的输入不同;所述DispersalDecoder为双路设计,上路负责预测人-物框,关注边框信息;下路负责关注人-物的自身以及外部信息并送入到交互解码器中;所述交互解码器共有三个输入:查询向量Qa、人物分散解码器和物体分散解码器的输出之和HO以及编码器编码后的全局特征编码XE,交互解码器使用额外辅助机制辅助判断人-物交互类别;所述额外辅助机制利用人-物之间的相对位置、人-物框的交互比、人-物框的面积比信息辅助判断人-物的交互类别。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于TED-Net的非接触人-物交互检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术