首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种改进的基于置信度SOM模型聚类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明公开了一种改进的基于置信度SOM模型聚类方法。样本数据先由k‑means算法初步分类,为模型训练提供更多的数据信息;将预分类后的数据分别训练相互独立的SOM模型,以消除不同类之间的影响;在传统SOM模型基础上提出置信度矩阵概念,通过综合判断获胜神经元的置信度及其与输入数据间的欧氏距离最终得到置信神经元,根据置信神经元所属类别给数据分配聚类标签。利用icSOM对莺尾花数据集IRIS聚类分析,实验结果表明,本发明可以更好地处理样本数据,取得较好的聚类效果。

主权项:1.一种改进的基于置信度SOM模型聚类方法,其特征在于:样本数据先由k-means算法初步分类,传统无监督学习提供了更多的数据信息量;将分类后的数据分别训练SOM模型,以消除不同类之间的影响;在传统SOM模型基础上提出置信度矩阵概念,通过综合判断获胜神经元的置信度及其与输入数据间的欧氏距离最终得到置信神经元,根据置信神经元所属类别给数据分配聚类标签;最终达到提升聚类结果准确度的优化目标,理论推导步骤包括:假设每个SOM模型输入层由D个节点组成,其中D与输入特征维度相同;输出层包含M个神经元节点,形成二维矩阵,其中M=X*Y,依据经验公式令其中N为训练样本数量,随机初始化各神经元节点对应的权重向量值wiji=1,2...D,j=1,2...M,生成初始化权重矩阵W,其大小为M*D,设置初始学习率η0、初始邻域衰减率δ0、迭代次数T,设置一个零矩阵作为初始置信度矩阵;样本数据预处理,输入训练数据datas并进行归一化和正则化预处理,使样本数据特征有相同度量尺度且避免数据过拟合; 使用k-means算法对数据预分类,随机选取k个点作为初始聚类中心;将每一个样本数据x∈datas分配给距其最近的中心点,并重新计算该类的中心;达到迭代终止条件后,实现了将数据预分类为k类datas1,datas2,...datask,每类数据的特征可由其中心点权重向量表示;将datas1,datas2,...datask作为训练数据,分别训练SOM模型,得到SOM1,SOM2,...SOMk,每个模型训练流程包括:选取一个样本数据x∈datas,计算与各神经元节点间的欧氏距离,dis=||x-wij||3选取距离最近的点cx,cy作为激活点,也就是样本x映射在输出层的获胜神经元,dis为样本数据x与各神经元节点间的欧氏距离;计算权重系数,更新邻域函数,令激活点的权重系数为1;其它神经元节点计算与激活点间的距离得到自身的权重系数,得到本次迭代对应的邻域函数: 其中,gi,j为每个神经元节点在当前迭代中的邻域函数,δ为邻域衰减率,δ随迭代次数增加而减小,以实现随迭代次数增加而降低影响程度,其更新公式如下: 其中t为当前迭代次数,tmax为最大迭代次数;同时,更新学习率, 更新权重矩阵,该过程类似于寻找聚类中心,每次更新都使wij更接近x:Wt+1=Wt+ηggx-Wt7其中,g为每个神经元节点在本次迭代中的邻域函数所组成的邻域函数矩阵,Wt为第t次迭代时的权重矩阵;更新各神经元节点的置信度增量Δc: 当满足迭代终止条件后,完成训练,得到各SOM模型对应的权重矩阵W、置信度矩阵C,此时各SOM模型输出层上的每个神经元的权重向量都与映射在其上的输入数据的均值无限相似,所以各神经元用于表征输入数据的特征: 其中,xmean为映射在该神经元上的输入数据的均值。

全文数据:

权利要求:

百度查询: 南京邮电大学 一种改进的基于置信度SOM模型聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。