Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜广州画魂网络科技有限公司周丽芳获国家专利权

恭喜广州画魂网络科技有限公司周丽芳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜广州画魂网络科技有限公司申请的专利一种基于区域自注意力卷积神经网络的人脸表情识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114842534B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210492125.5,技术领域涉及:G06V40/16;该发明授权一种基于区域自注意力卷积神经网络的人脸表情识别方法是由周丽芳;王懿;江志程;丁相;栗思秦;邓广设计研发完成,并于2022-05-07向国家知识产权局提交的专利申请。

一种基于区域自注意力卷积神经网络的人脸表情识别方法在说明书摘要公布了:本发明请求保护一种基于区域自注意力卷积神经网络的人脸表情识别方法,属于模式识别与计算机视觉技术领域包括以下步骤:首先,利用VGG16网络提取输入图像的深度全局特征,在提取特征的同时保留面部表情的全局信息。其次,通过设计的区域局部多值模式与改进的K‑means算法对像素进行动态聚类,保证表情变化区域特征的鲁棒性,并将二值模式扩展到多个模式,整合区域内像素间的灰度差信息,增强纹理描述。此外,通过自注意机制形成区域权值,并使用秩正则化损失约束不同区域的权值。最后,将加权特征与深度网络提取的特征相结合,增强特征的表征能力。本发明旨在建立一个鲁棒的人脸表情识别网络来准确地估计真实环境中面部表情的类别。

本发明授权一种基于区域自注意力卷积神经网络的人脸表情识别方法在权利要求书中公布了:1.一种基于区域自注意力卷积神经网络的人脸表情识别方法,其特征在于,包括以下步骤:步骤1:将原始表情图像输入到以VGG16为基础的特征提取网络,提取输入表情图像的深度全局特征;步骤2:设计区域局部多值模式,将原始表情图像输入到区域局部多值模式对区域纹理进行增强;其中,所述的区域局部多值模式利用改进的K-means算法对像素进行动态聚类;在改进的K-means算法中,首先计算每个数据点到原点的距离;然后,根据排序后的距离对原始数据点进行排序,将排序后的数据点划分为k个相等的集合,每组中以中间点为初始质心;这些初始质心获得更好的独特聚类结果;通过改进的K-means算法能够保证表情变化区域特征的鲁棒性,并将二值模式扩展到k个模式,整合区域内像素间的灰度差信息,增强区域纹理特征;步骤3:将增强过的区域纹理特征输入到区域自注意模块,区域自注意模块包含区域自注意机制和秩正则化损失,区域自注意机制增强表情显著变化区域特征的权重,量化不同区域对表情识别的贡献,得到增强后的区域纹理注意特征;而秩正则化损失被用来约束不同区域的权重,使不同区域的权重值更有区分度;步骤4:将步骤3提取到的区域加权特征与VGG网络提取的深度全局特征进行融合;所述步骤3,将增强过的区域纹理特征输入到区域自注意模块,区域自注意模块包含区域自注意机制和秩正则化损失,区域自注意机制增强表情显著变化区域特征的权重,量化不同区域对表情识别的贡献,得到增强后的区域纹理注意特征;而秩正则化损失被用来约束不同区域的权重,使不同区域的权重值更有区分度;具体包含以下步骤:C1:将在B4步骤中得到的鲁棒的特征表示Fr输入到降维卷积神经网络,得到每个区域的深度特征图,定义输入的区域纹理图像为I1,I2,…,I9,降维卷积神经网络的定义如下:X=[F1,F2,…,F9]=[VI1;θ,VI2;θ,…,VI9;θ]4其中V·;θ为降维卷积神经网络,θ为降维卷积神经网络中的参数,X是通过降维卷积神经网络提取到的区域特征集合;C2:为了得到每个区域在人脸表情识别任务中的贡献,利用自我注意机制获取每个区域的权重,通过FC和Sigmoid函数计算特征的粗略权值,定义如下:W=[a1,a2,…,ak]=[fF1Tq,fF2Tq,…,fF9Tq]5其中ai表示第i个区域的权值,f表示Sigmoid函数,q表示全连接层的参数,将所有具有注意权重的局部特征归纳为一个整体表示Fm,其定义如下: 这里,s表示特征块之间的级联操作;C3:引用秩正则化损失RRLoss来约束不同区域的权值;首先对不同区域的权重进行排序,然后按照一定的比例将其分为高权重组和低权重组;其次,计算高、低权重组的平均权重,分别用ahigh和alow表示;在RRLoss中添加差值M以限制这些组的平均权重,其定义如下所示: LRR=max{0,M-ahigh-alow}9Ghigh和Glow分别表示高权重组和低权重组的权重均值,λ表示高权重组所占的比例,N表示区域的个数;M是一个差值,它是一个固定的可学习参数或超参数,LRR用于增强区域关注的权重,鼓励网络在训练过程中优先关注表情变化区域。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州画魂网络科技有限公司,其通讯地址为:510000 广东省广州市天河区天河北路721号三楼自编01-255房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。