首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于特征聚类和标签相似性的标签增强方法 

申请/专利权人:浙江工商大学

申请日:2021-01-22

公开(公告)日:2024-06-28

公开(公告)号:CN112766383B

主分类号:G06F18/23

分类号:G06F18/23;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.05.25#实质审查的生效;2021.05.07#公开

摘要:本发明提出了一种基于特征聚类和标签相似性的新型标签增强方法。本发明采用的方法如下:给定多标签样本的集合M,将集合M分成两部分,一部分是表示特征的集合F,另一部分表示标签的集合L;先对集合M进行预处理,主要包括数据缺失值处理、数据归一化;通过一种基于特征聚类和标签相似性的方法找到样本a的邻近样本集合S;确定邻近样本集合S之后,通过标签权重的方法将样本a的标签从多标签数据状态,转化成标签分布的标签描述度;需要对所有的样本基于特征聚类和标签相似性的方法和标签权重的方法,得到标签分布的集合D。本发明简单高效,结合特征信息和标签信息,能有效地将多标签数据集转成标签分布数据集。

主权项:1.一种基于特征聚类和标签相似性的标签增强方法,其特征在于该方法包括以下步骤:步骤1:给定多标签面部表情识别的集合M,将集合M分成两部分,一部分是表示特征的集合F,另一部分表示标签的集合L;步骤2:对集合M进行预处理,主要包括数据缺失值处理、数据归一化;步骤3:通过一种基于特征聚类和标签相似性的方法找到面部表情识别a的邻近面部表情识别集合S;步骤4:确定邻近面部表情识别集合S之后,通过标签权重的方法将面部表情识别a的标签从多标签数据状态,转化成标签分布的标签描述度;步骤5:对所有的面部表情识别重复步骤3和4,得到标签分布的集合D;步骤3中所述的基于特征聚类和标签相似性的方法具体是:通过计算特征聚类得到集合S1,通过计算标签相似性得到集合S2;将在集合S1和集合S2都出现的面部表情识别添加到邻近面部表情识别集合S中;所述的特征聚类是指计算面部表情识别a的特征与其它面部表情识别的特征之间的距离,如果某个面部表情识别b的特征与面部表情识别a的特征之间的距离小于阈值,将面部表情识别b的序号加入到集合S1中;所述的标签相似性是指面部表情识别a的标签与其它面部表情识别的标签之间的相似性,如果某个面部表情识别b的标签与面部表情识别a的标签之间的距离大于阈值,将面部表情识别b的序号加入到集合S2中;所述距离采用以下公式计算: 其中k=2,即欧式距离,ai,bi表示面部表情识别a,b的特征,p表示特征的个数;所述的标签相似性采用杰卡德系数,采用以下公式计算: 其中A表示面部表情识别a的标签,B表示面部表情识别b的标签;步骤4中标签权重的方法具体是:根据邻近面部表情识别集合S中所有面部表情识别的标签来构建矩阵;统计矩阵中所有标签为1的个数,记为X;统计矩阵每一列标签为1的个数,使用向量表示为:Y={y1,y2,…,yq};则标签权重LW表示为:对标签A进行权重化,得到Z: 对Z进行归一化操作,得到LD作为面部表情识别a的标签分布的标签描述度,q表示标签的个数。

全文数据:

权利要求:

百度查询: 浙江工商大学 一种基于特征聚类和标签相似性的标签增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。