一种基于主题集成聚类的产品典型性特质挖掘方法及系统

导航：龙图腾网> 最新专利技术> 一种基于主题集成聚类的产品典型性特质挖掘方法及系统

申请/专利权人：西安邮电大学

申请日：2022-03-02

公开（公告）日：2024-06-28

公开（公告）号：CN114792246B

主分类号：G06Q30/0201

分类号：G06Q30/0201;G06Q30/0203;G06Q30/0282;G06F40/289

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2022.08.12#实质审查的生效;2022.07.26#公开

摘要：本发明公开了一种基于主题集成聚类的产品典型性特质挖掘方法及系统，构造融入词性信息的LDA主题模型，并将多个LDA主题模型获取的聚类结果作为原始数据的新增属性，计算原始数据在基聚类空间内的相关性，构建最大相关系数矩阵；获取最大相关系数矩阵的相应划分，实现主题聚类集成；构建任意文本中某一个词在特定窗口下的词性属性矩阵，并在该词的词性属性矩阵中引入文本的主题概率，利用集成学习方法对同一个词的多个词性属性矩阵进行集成，获取词的词性标记序列向量；利用词对相似度排序方法获取产品短评文本的典型性特质。本发明解决了对短评文本进行产品典型性特质挖掘时所存在的语义表征丢失、聚类效率低以及可解释能力不足等问题。

主权项：1.一种基于主题集成聚类的产品典型性特质挖掘方法，其特征在于，包括以下步骤：S1、对评论文本数据进行预处理，保留分词结果中的词性信息，再利用文本不同的词性筛选，构建融入词性信息的LDA主题模型；S2、利用步骤S1构建的多个融入词性信息的LDA主题模型，将LDA主题模型获取的聚类结果作为原始评论文本数据的新增属性；通过最大互信息系数方法计算原始评论文本数据在基聚类空间内的相关性，构建最大相关系数矩阵；采用对称非负矩阵分解方法获取最大相关系数矩阵的相应划分，完成原始评论文本数据主题聚类集成，具体为：S201、在步骤S101获取的语料库D上，重复运算S次词性LDA模型，获得语料库D的聚类结果Q；S202、根据MIC方法，计算步骤S201得到的聚类结果Q的相似性矩阵X，构建相似性矩阵X具体为：S2021、通过步骤S201获取N*S的基聚类结果矩阵Q，其中，N为语料库D中的文档数，S为不同聚类算法计算的结果数；S2022、对步骤S2021基聚类结果矩阵Q中的每个行向量，计算向量之间的互信息值ITi；Tj；再次，归一化ITi；Tj值，将ITi；Tj值转化到0，1区间之内；S2023、重复步骤S2021和步骤S2022，得到所有向量间的归一化互信息值，构建N*N维的相似性矩阵X；S203、使用SyNMF对步骤S202得到的相似性矩阵X进行聚类，得到主题聚类集成结果，对相似性矩阵X进行聚类具体为：构造相似性矩阵X的SyNMF分解模型；利用拉格朗日乘子方法及KKT条件求解SyNMF分解模型中的Hij；对SyNMF分解模型中的过程矩阵H进行二值化处理；获得语料库D的集成聚类标签H*；S3、利用步骤S2得到的原始评论文本数据主题聚类集成构建任意文本中某一个词在特定窗口下的词性属性矩阵，并在词性属性矩阵中引入文本的主题概率，利用集成学习方法对同一个词的多个词性属性矩阵进行集成，通过预置的位置属性向量与词性属性矩阵的乘积，获取词的词性标记序列向量，利用词对相似度排序方法，获取产品短评文本的典型性特质，实现对产品的特性描述，具体为：S301、在步骤S2获得的任意聚类评论集中，构造每个词wi的词性属性矩阵词性属性矩阵的构造方法为：选取每个词前后各2个相邻词组成其词性序列，考虑相邻的实词形式，词性标注按顺序依次为n，v，a，m，q，r，b；词性属性矩阵V的元素vi,j为：其中，1≤i≤5，1≤j≤7；S302、在步骤S301构造的每个词wi的词性属性矩阵中引入所属文本的主题概率信息，并对同一个词wi的多个词性属性矩阵进行集成，利用词性位置权重信息，构建词性标记序列向量Poswi；S303、利用实词两两组合的策略，构建步骤S301中聚类评论集的无序词对；S304、通过步骤S302构建的词性标记序列向量Poswi，计算步骤S303所获得词对中对应词的词性标记序列向量差，构建无序词对的向量集合Pt；S305、在步骤S304获得集合Pt未被标记的数据点中任选一个点p作为中心点；S306、将距离中心点p，半径为h范围内的所有点记为集合G，指定集合G属于簇R，把簇R对集合G内点的访问频率加1；S307、以p为中心点，计算p点到步骤S306的集合G中每个点的向量，并将向量相加，得到的结果为Mean-Shift向量；S308、中心点p沿Mean-Shift方向移动，移动距离为||Mean-Shift||；重复步骤S306～S308，直到||Mean-Shift||t，t为阈值，此时中心点p迭代收敛，将迭代过程中遇到的所有数据点都归类为簇R；S309、当中心点p收敛时，如果簇R的中心点与其他已经存在的簇中心点距离小于阈值，将这两个簇合并，否则，把簇R作为新的聚类，增加1类；重复步骤S305～S309直到所有的数据点都已被标记访问；S3010、根据每个类，对每个点的访问频率，取访问频率最大的类作为当前点集的所属类；S3011、对每个簇中的词对进行自身相似度排序，各自选取绝对值最高的L个词对，构建产品典型性特质的可解释性描述集Y。

全文数据：

权利要求：

百度查询：西安邮电大学一种基于主题集成聚类的产品典型性特质挖掘方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种连续制备五氯化磷的装置

下一篇：一种隐框式岩板蜂窝复合板

相关技术

一种连续制备五氯化磷的装置

一种隐框式岩板蜂窝复合板

一种机罩

一种预应力钢绞线辅助穿束防缠绕工具

一种圆管弯曲成型装置

一种砂浆压实装置

一种数控机床主轴箱冷却装置

一种酶转化罐内部恒温搅拌机构

一种细分子印刷喷粉加工用研磨装置

一种零部件加工的表面喷漆装置

一种新型全遮光窗帘面料

一种薄荷醇制取用原料粉碎装置

典型性相关技术

吸收性物品_王子控股株式会社_202321693020.2

密封性检测方法及密封性检测工装_巨安储能武汉科技有限责任公司_202410220481.0

移动网络中的空闲/不活动移动性和可达性_交互数字专利控股公司_201980083311.X

用于增强的切换的移动性鲁棒性和处理_诺基亚技术有限公司_201880100575.7

钢笔密封性检测装置_青岛亚坦文具有限公司_202410493992.X

非感光性树脂组合物_日产化学株式会社_202410359132.7

轴封气密性检测装置_菱恩杰精密智能装备(苏州)有限公司_202323044177.5

高正确性指纹侦测方法_速博思股份有限公司_201911367181.0

电芯气密性检测装置_山东派智新能源科技有限公司_202323397267.2

一次性门诊宫腔镜_上海宇度医学科技股份有限公司_201711418567.0

特质相关技术

三觉优势特质评测仪_雷琼_201910669468.2

一种基于购物评论的人格特质分析方法及系统_北京工业大学_202210146150.8

一种基于眼动特征的孤独特质程度检测装置_天津大学_202211533221.6

使用血管外图像识别血管特质的系统和方法_光实验成像公司_202280056516.0

基于探索场景引导的自身特质发现方法及装置_纬英数字科技(广州)有限公司_202310594923.3

考虑用户人格特质与主题偏好的社区专家推荐方法和系统_合肥工业大学_202311589601.6

基于高温超塑性特质的全陶瓷自润滑关节轴承成形方法_天津理工大学_202311573783.8

用于特质材料表面加工的涂覆模具_南通四通林业机械制造安装有限公司_202311573206.9

基于渐进自适应模态增强注意力网络的多模态人格特质分析方法_杭州电子科技大学_202311385592.9

基于LDA主题模型的主播形象分类与关键特质分析方法_哈尔滨工业大学_202310161332.7

产品相关技术

一种产品推荐方法、装置、设备、存储介质和程序产品_中国工商银行股份有限公司_202410431393.5

图像生成方法、图像生成模型产品及计算机程序产品_阿里巴巴(中国)有限公司_202410333730.7

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

通信方法、设备、系统、产品及介质_华为技术有限公司_202211699245.9

信息保存方法及相关产品_平安证券股份有限公司_202010754827.7

数据处理方法及相关产品_RealMe重庆移动通信有限公司_202211702760.8

一种产品模型展示台_北京林业大学_202323283491.9

视频缓存方法及相关产品_行吟信息科技(上海)有限公司_202410457282.1

一种产品输入电源切换产品不掉电自动化测试系统及方法_通标标准技术服务(上海)有限公司_202010893287.0

一种平锻机产品顶出机构_高密三江机械制造有限公司_202410504641.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于主题集成聚类的产品典型性特质挖掘方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务