改进的多尺度注意残差关系感知的表情识别方法及装置

导航：龙图腾网> 最新专利技术> 改进的多尺度注意残差关系感知的表情识别方法及装置

申请/专利权人：齐鲁工业大学(山东省科学院);山东省人工智能研究院

申请日：2024-04-10

公开（公告）日：2024-06-25

公开（公告）号：CN118015687B

主分类号：G06V40/16

分类号：G06V40/16;G06V10/44;G06V10/764;G06V10/774;G06V10/776;G06V10/82;G06N3/0464;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要：本发明涉及表情识别技术领域，尤其涉及一种改进的多尺度注意残差关系感知的表情识别方法及装置。步骤如下：将人脸图像划分为训练集和验证集，并进行数据预处理，得到输出的特征T；构建卷积神经网络；将卷积神经网络得到的特征通过卷积层和Reshape操作，将特征图转换成为一个的特征向量序列；将得到的特征向量序列加上classtoken和位置编码输入到多个堆叠的TransformerEncoder模块中，得到融合了其他向量特征的classtoken，将classtoken输入到MLPhead分类器，得出最后的表情识别结果。本发明可以使模型从通道、空间两个维度上关注对表情识别重要的面部特征，抑制无关的特征，更有效的提取面部表情的判别性信息特征，能够完成更加准确的表情识别效果。

主权项：1.一种改进的多尺度注意残差关系感知的表情识别方法，其特征是，包括如下步骤：a：将人脸图像划分为训练集和验证集，并进行数据预处理，将处理好的图像输入到3×3的卷积层，得到输出的特征；b：构建卷积神经网络,卷积神经网络结构包括InAResBlock0模块、InAResBlock1模块、InAResBlock2模块：InAResBlock0模块包括两个改进的残差块，每个残差块都包含一个Inceptionblock0模块、ICBAM模块以及卷积层，其中卷积核大小为3×3，步长为2，填充为1，卷积层之后是正则化层和ReLU激活函数层；每个Inceptionblock0模块包括五个分支，即、、、；第一个分支由最大池化层、卷积层、正则化层和ReLU激活函数组成，其中最大池化层的卷积核大小为3×3，步长为1，填充为1，卷积层的卷积核大小为1×1，步长为1，填充为0，初始特征图T经过的最大池化层得到特征，特征输入到的卷积层，得到特征；第二个分支由卷积层、正则化层和ReLU激活函数层组成，其中卷积层的卷积核大小为1×1，步长为1，填充为0，初始特征图T输入到的卷积层，得到特征；第三个分支包括两个卷积层，每个卷积层之后都有一个正则化层以及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层的卷积核大小为3×3，步长为1，填充为1，初始特征图T经过的第一个卷积层得到特征，特征输入到的第二个卷积层得到特征；第四个分支包括三个卷积层，每个卷积层之后都有一个正则化层以及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层和第三个卷积层的卷积核大小为3×3，步长为1，填充为1，初始特征图T经过的第一个卷积层得到特征，特征输入到的第二个卷积层得到特征，特征输入得到的第三个卷积层得到特征；第五个分支包括四个卷积层，每个卷积层之后都有一个正则化层及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层、第三个卷积层和第四个卷积层的卷积核大小都为3×3，步长为1，填充为1；初始特征图T输入到的第一个卷积层得到特征，特征输入到的第二个卷积层得到特征，特征输入到的第三个卷积层得到特征，特征输入到的第四个卷积层得到特征；将特征、、、、在通道维度上拼接得到特征，特征输入到ReLU激活函数层，得到特征；具体来说，Inceptionblock0模块可以表示为：，其中，代表relu激活函数，代表卷积核为1×1的卷积操作，代表卷积核为3×3的卷积操作；ICAM模块包括并联的最大池化层和平均池化层、两个并联的一维卷积层、ReLU激活函数层、Sigmoid激活函数层；最大池化层的卷积核大小为输入特征图的长×宽，步长为1，填充为0，平均池化层的卷积核大小为输入特征图的长×宽，步长为1，填充为0，一维卷积层的卷积核大小自适应，即，其中C为输入特征图的通道数，为可调系数，设置为2，b为常数，设置为1，填充为k-12；ISAM模块包括最大池化层、平均池化层、二维卷积层、正则化层、ReLU激活函数层以及Sigmoid激活函数层，其中最大池化层和平均池化层的卷积核大小都为1，步长为1，填充为1，二维卷积层的卷积核大小自适应，即，其中C为输入特征图的通道数，为可调系数，设置为2，b为常数，设置为1，步长为1，填充为k-12；特征输入到最大池化层，得到特征，特征输入到一维卷积层得到特征；特征输入到平均池化层得到特征，特征输入到一维卷积层得到特征，将特征和特征做一个逐元素相加的操作得到特征,特征输入到Sigmoid激活函数层得到具有通道注意力的特征图，将特征与特征进行一个逐元素相乘的操作，得到特征；特征分别输入的ISAM的最大池化层和平均池化层，分别得到特征和特征，将特征和特征在通道维度上进行拼接得到特征，特征输入到二维卷积层得到特征，特征输入到激活函数层得到具有空间注意力的特征图，将特征和特征做一个逐元素相乘操作得到ICBAM模块最后的输出特征图；具体来说，整个ICBAM模块可以表示为：=，其中代表ICAM模块，代表ISAM模块；将特征输入到第一个残差模块的最后一个卷积层，得到特征，将初始特征图T与特征进行一个逐元素相加的操作，然后再输入到ReLU激活函数层，得到第一个残差模块最终的输出特征；将特征输入到InAResBlock0模块的第二个残差块，第二个残差块的结构和第一个残差块的结构相同，得到最终的输出特征，整个InAResBlock0模块的计算过程可以表示为：，；其中，T表示初始特征图，表示卷积核为3×3的卷积操作，表示ICBAM模块，表示Inceptionblock0模块；b1：将特征T输入到InAResBlock0模块，得到特征；b2：将特征输入到InAResBlock1模块，得到特征；b21：InAResblock1包括两个残差块，每个残差块都包含一个Inceptionblock1模块、ICBAM模块以及卷积层，其中卷积核大小为3×3，步长为2，填充为1，卷积层之后是正则化层和ReLU激活函数层；b22：每个Inceptionblock1模块包括四个分支、、;第一个分支由最大池化层、卷积层、正则化层和ReLU激活函数组成，其中最大池化层的卷积核大小为3×3，步长为1，填充为1，卷积层的卷积核大小为1×1，步长为1，填充为0；第二个分支由卷积层、正则化层和ReLU激活函数层组成，其中卷积层的卷积核大小为1×1，步长为1，填充为0；第三个分支包括两个卷积层，每个卷积层之后都有一个正则化层以及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层的卷积核大小为3×3，步长为1，填充为1；第四个分支包括三个卷积层，每个卷积层之后都有一个正则化层以及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层和第三个卷积层的卷积核大小为3×3，步长为1，填充为1;初始特征图经过，初始特征图经过得到特征，初始特征图经过得到特征，初始特征图经过得到特征，将特征、、、在通道维度上拼接得到特征，特征输入到ReLU激活函数层，得到特征；具体来说，Inceptionblock1模块可以表示为：，其中，代表relu激活函数，代表卷积核为1×1的卷积操作，代表卷积核为3×3的卷积操作，代表最大池化操作；b23：InAResblock1模块中ICBAM模块和InAResblock0中的ICBAM模块结构相同；特征输入到ICAM模块，得到的输出再输入到ISAM模块;具体的过程为：特征输入到最大池化层，得到特征，特征输入到一维卷积层得到特征；特征输入到平均池化层得到特征，特征输入到一维卷积层得到特征，将特征和特征做一个逐元素相加的操作得到特征,特征输入到Sigmoid激活函数层得到具有通道注意力的特征图，将特征与特征进行一个逐元素相乘的操作，得到特征;特征分别输入的ISAM的最大池化层和平均池化层，分别得到特征和特征，将特征和特征在通道维度上进行拼接得到特征，特征输入到二维卷积层得到特征，特征输入到激活函数层得到具有空间注意力的特征图，将特征和特征做一个逐元素相乘操作得到ICBAM模块最后的输出特征图；具体来说，整个ICBAM模块可以表示为： =，其中代表ICAM模块，代表ISAM模块；b24：将特征输入到第一个残差模块的最后一个卷积层，得到特征，将初始特征图与特征进行一个逐元素相加的操作，输入到ReLU激活函数层，得到第一个残差模块最终的输出特征；b25：将特征输入到InAResBlock1模块的第二个残差块，第二个残差块的结构和第一个残差块的结构相同，得到最终的输出特征；整个InAResBlock1模块的计算过程可以表示为：，，其中，代表卷积核为3×3的卷积操作，表示ICBAM模块，表示Inceptionblock1模块；b3：将特征输入到InAResBlock2模块，得到特征；b31：InAResblock2包括两个残差块，每个残差块都包含一个Inceptionblock2模块、ICBAM模块以及卷积层，其中卷积核大小为3×3，步长为2，填充为1，卷积层之后是正则化层和ReLU激活函数层；b32：每个Inceptionblock2模块包括三个分支、；第一个分支由最大池化层、卷积层、正则化层和ReLU激活函数组成，其中最大池化层的卷积核大小为3×3，步长为1，填充为1，卷积层的卷积核大小为1×1，步长为1，填充为0；第二个分支由卷积层、正则化层和ReLU激活函数层组成，其中卷积层的卷积核大小为1×1，步长为1，填充为0；第三个分支包括两个卷积层，每个卷积层之后都有一个正则化层以及ReLU激活函数层，其中第一个卷积层的卷积核大小为1×1，步长为1，填充为0，第二个卷积层的卷积核大小为3×3，步长为1，填充为1；初始特征图经过；初始特征图经过得到特征；初始特征图经过得到特征，将特征、、在通道维度上拼接得到特征，特征输入到ReLU激活函数层，得到特征；具体来说，Inceptionblock2模块可以表示为：，其中，代表relu激活函数，代表卷积核为1×1的卷积操作，代表卷积核为3×3的卷积操作，代表最大池化操作；b33：特征输入到最大池化层，得到特征，特征输入到一维卷积层得到特征；特征输入到平均池化层得到特征，特征输入到一维卷积层得到特征，将特征和特征做一个逐元素相加的操作得到特征,特征输入到Sigmoid激活函数层得到具有通道注意力的特征图，将特征与特征进行一个逐元素相乘的操作，得到特征；特征分别输入的ISAM的最大池化层和平均池化层，分别得到特征和特征，将特征和特征在通道维度上进行拼接得到特征，特征输入到二维卷积层得到特征，特征输入到激活函数层，得到具有空间注意力的特征图，将特征和特征做一个逐元素相乘操作，得到ICBAM模块最后的输出特征图；具体来说，整个ICBAM模块可以表示为：，其中代表ICAM模块，代表ISAM模块；b34：将特征输入到第一个残差模块的最后一个卷积层，得到特征，将初始特征图与特征进行一个逐元素相加的操作，然后再输入到ReLU激活函数层，得到第一个残差模块最终的输出特征；b35：将特征输入到InAResBlock2模块的第二个残差块，第二个残差块的结构和第一个残差块的结构相同,得到最终的输出特征；整个InAResBlock2模块的计算过程可以表示为：，，其中，代表卷积核为3×3的卷积操作，表示ICBAM模块，表示Inceptionblock2模块；c：将得到的特征通过一个1×1的卷积层和Reshape操作，将特征转换成为一个的特征向量序列；d：将得到的特征向量序列加上classtoken和位置编码再输入到多个堆叠的TransformerEncoder模块中，得到融合了其他向量特征的classtoken，再将classtoken输入到MLPhead分类器，得出最后的表情识别结果。

全文数据：

权利要求：

百度查询：齐鲁工业大学(山东省科学院);山东省人工智能研究院改进的多尺度注意残差关系感知的表情识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种叠加机

下一篇：一种数控机床主轴箱冷却装置

相关技术

一种叠加机

一种数控机床主轴箱冷却装置

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

一种房建施工用安全防坠装置

一种安装工具

一种用于光伏发电装置的R型回转减速机

生产混凝土用碎石仓

一种配电网规划用的智慧配电网架

一种公共卫生用预防传染病喷雾装置

一种薄荷醇制取用原料粉碎装置

一种防滑型无纺布的裁剪装置

一种纸尿裤生产用包边机

感知相关技术

射频状况感知的音频缓冲_谷歌有限责任公司_201980084274.4

城市生命线全息感知监测预警方法_中交路桥科技有限公司_202410471935.1

一种基于机器学习进行威胁建模的攻击感知检测方法_广东亿迅科技有限公司_202211686570.1

通信辅助感知场景下的高效数据增强优化方法及相关设备_北京邮电大学_202410209971.0

基于多种权重优化融合的频谱感知方法及系统_中国电子科技集团公司第七研究所_202410243706.4

一种预制装配式智能感知路面板_山东高速集团有限公司_202322970744.3

一种压缩感知雷达超分辨成像方法、系统及设备_中国人民解放军战略支援部队航天工程大学士官学校_202311798742.9

基于语义感知的激光雷达定位方法、装置及可读介质_厦门大学_202410520586.8

一种用于自动驾驶感知的多传感器联合标定方法_广东工业大学_202410482109.7

基于多尺度特征智能感知的社交网络图像篡改定位方法_山东省人工智能研究院_202210730860.5

差相关技术

一种基于抗差赫尔默特定权的光束法平差方法及系统_同济大学_202410214723.5

一种曲面压差贴合装置_苏州希盟科技股份有限公司_202323221773.6

一种主动压差式旁路回流机构_浙江倍时信息科技有限公司_202323451995.7

一种轮辐摆差检测装置_长春伦艺机电设备有限公司_202323350073.7

一种压差补偿滴头_莱芜春雨节水器材有限公司_202310073451.7

差压传感器感应膜片张紧工装_重庆市伟岸测器制造股份有限公司_202322521158.0

差分对电路及其信号传输方法、显示面板_惠科股份有限公司_202310608814.2

应用声速差测定油井动液面的装置_中国石油天然气股份有限公司_202211688084.3

差速锁控制器的异常监控方法、装置、设备及存储介质_长城汽车股份有限公司_202210444587.X

流体介质用的提升阀和借助差压测量确定体积流量的装置_奥文特罗普有限责任两合公司_202311805592.X

关系相关技术

基于BiLSTM结合全局指针的重叠关系抽取系统_重庆邮电大学_202210593426.7

确定网站的引用关系表方法和装置_北京国双科技有限公司_202211694619.8

基于分离时空关系的群体行为识别方法、设备和介质_湘潭大学_202211639093.3

基于关系网络的智能化流程处理系统、装置及方法_重庆治略科技有限公司_202110219770.5

用于眼底血管图像分类的训练方法及相关系统和方法_中山大学中山眼科中心_202410352298.6

端云算力协同调度方法、相关系统及设备_华为技术有限公司_202311376083.X

一种基于多关系图的源代码漏洞检测方法_兰州交通大学_202410525501.5

一种基于核心关系发现的贷款欺诈客户识别方法_奇瑞徽银汽车金融股份有限公司_202410351234.4

基于细粒度特征学习与相对关系建模的多目标跟踪方法_浙江谱麦科技有限公司_202410414009.0

水下侧向局域共振超材料板结构色散关系构建方法及系统_华中科技大学_202410197870.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

改进的多尺度注意残差关系感知的表情识别方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务