首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】结合深度学习分类与图聚类的社交媒体事件检测方法_昆明理工大学_202410373064.X 

申请/专利权人:昆明理工大学

申请日:2024-03-29

公开(公告)日:2024-06-18

公开(公告)号:CN117974340B

主分类号:G06Q50/00

分类号:G06Q50/00;G06F16/35;G06F18/213;G06F18/22;G06F18/2323;G06F18/241;G06N3/0455;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明公开了结合深度学习分类与图聚类的社交媒体事件检测方法,基于消息文本与提取的特征信息,构建得到消息异构图;在消息对中构建多条共享特征边,构建得到多关系消息图;利用深度学习分类模型得到消息对的相似度;若消息对的相似度达到预设阈值,则在消息对中构建一条边,构建得到消息同构图;将消息同构图作为图聚类算法的输入进行聚类,得到社交媒体事件检测结果。本发明避免了将社交消息表示为向量的过程,以消息对的异构关联和消息文本为输入,利用深度学习分类模型差判别消息对是否属于同一事件,并通过消息对的预测结果构建消息同构图,利用图聚类算法发现具有紧密关联的社交消息簇作为社交事件,用于海量的社交媒体事件检测任务。

主权项:1.一种结合深度学习分类与图聚类的社交媒体事件检测方法,其特征在于,所述方法包括:对社交媒体数据流中的消息文本进行特征信息提取,将消息文本及特征信息作为节点,并将消息文本与其提取的特征信息连接构成边,构建得到消息异构图;基于所述消息异构图,随机选取两个消息文本节点构建消息对,并在每对消息对中构建多条共享特征边,构建得到多关系消息图;基于所述多关系消息图,利用深度学习分类模型得到消息对的相似度;判断消息对的相似度是否达到预设阈值,若消息对的相似度达到预设阈值,则在组成消息对的两个消息文本节点之间构建一条边,构建得到消息同构图;将构建的消息同构图作为图聚类算法的输入进行聚类,聚类结果作为检测到的社交媒体事件;基于所述消息异构图,随机选取两个消息文本节点构建消息对,并在每对消息对中构建多条共享特征边,构建得到多关系消息图,具体包括:定义多关系消息图为其中M是消息文本节点集合{m1,m2,…,mn},n是消息文本节点个数,每个节点具有不同的特征表示并具有表示成的d维特征向量,将消息节点类型表示为m,u,e,h和t分别代表消息、用户、实体、话题标签和时间信息,所有节点特征的集合表示为从其他消息文本中随机采样与节点mi构建成消息对mij={mi,mj};当消息文本共享不同类型的特征信息时分别建立属于不同共享特征关系的边,是消息对mij中的边,边能关联多种共享特征关系: 其中Amr是消息异构图的邻接矩阵的子矩阵,行代表所有的特征信息节点,列代表属于关系r的所有消息节点,T是矩阵的转置;基于所述多关系消息图,利用深度学习分类模型得到消息对的相似度,具体包括:对消息文本进行预处理,包括进行分词和去停用词操作,然后通过BERT预训练语言模型对消息文本进行词嵌入处理,用d维词向量si表示词,si∈Rd;对消息文本向量S={s1,s2…,sn}进行嵌入得消息文本Si的嵌入向量bi,消息文本Sj的嵌入向量bj,将两个消息文本的嵌入向量通过编码层拼接后得到消息对的编码向量: 其中,表示向量的拼接操作;将得到的编码向量通过线性变换层得到低维向量hp,并通过Sigmoid激活函数得到消息文本Si和Sj的相似度LP,其中LP∈0,1: LP=SigmoidWphp+fp其中,Wp和fp表示模型中的参数,σ表示激活函数;判断消息对的相似度是否达到预设阈值,若消息对的相似度达到预设阈值,则在组成消息对的两个消息文本节点之间构建一条边,构建得到消息同构图,具体包括:消息同构图仍保留消息异构图的所有公共特征, 其中H∈{0,1}N×N是消息同构图的邻接矩阵,其中N是图中消息节点的总数,r表示节点类型,Amr是消息异构图中邻接矩阵的子矩阵,包含m类型的行和r类型的列,T是矩阵的转置;如果消息文本节点mi和消息文本节点mj连接到一些类型的k节点时,将大于或等于1,则Hi,j将等于1;对于消息文本mi和消息文本mj组成的消息对,判断消息对的相似度LP是否达到预设阈值F,当相似度达到预设阈值F时便构建一条边e'ij,判断完所有的消息对后构成初始消息同构图G'V',E',其中V'是消息文本节点集合,E'是边集合。

全文数据:

权利要求:

百度查询: 昆明理工大学 结合深度学习分类与图聚类的社交媒体事件检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。