首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种社交媒体危机事件预测方法及系统_厦门大学_202210201984.4 

申请/专利权人:厦门大学

申请日:2022-03-03

公开(公告)日:2024-05-31

公开(公告)号:CN114580738B

主分类号:G06Q10/04

分类号:G06Q10/04;G06Q50/00;G06Q50/26;G06F16/33;G06N3/045;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.05.31#授权;2022.06.21#实质审查的生效;2022.06.03#公开

摘要:本发明涉及一种社交媒体危机事件预测方法及系统。所述方法包括:使用预训练词向量GloVe将原始事件表示成事件向量;根据原始事件的事件向量,使用卷积神经网络和注意力机制获取原始事件的特征向量,包括已知事件的特征向量和候选事件的特征向量;使用点乘相似度计算指标来计算已知事件的特征向量和候选事件的特征向量之间的相似度;根据已知事件的特征向量和候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。本发明方法利用卷积神经网络和注意力机制来对事件提取特征,并根据事件间的特征相似度进行预测,能够提高事件预测的鲁棒性和准确性;并且本发明方法不依赖外部知识库,具有很强的通用性。

主权项:1.一种社交媒体危机事件预测方法,其特征在于,包括:使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件e为关于社交媒体中危机事件的已知事件ei或候选事件ecj;根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量,具体包括:步骤2.1:采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;采用以下公式对原始事件e的事件向量Ve生成特征映射Ch:Ci=fWh·Ve[i:i+h-1]+b;Ch=[C1;...;C4-h+1];其中,Wh∈Rh×d是卷积核;Ve[i:i+h-1]表示事件向量Ve中第i至第i+h-1个论元向量的拼接,i=1,2,...,4-h+1;h是卷积的窗口大小;d是词向量嵌入的维数;b是偏差项;·是点乘运算;f·是GELU激活函数;Ci为中间参数;使用k个卷积核来获得多种类型的特征,此时一个事件向量Ve生成特征映射Ch形状变为Ch∈R4-h+1×k;步骤2.2:采用注意力机制计算所述特征映射的自注意力矩阵;采用如下公式对h=1和h=2这两种窗口大小的卷积核生成的特征映射Ch=1,2计算自注意力:Call=[C1;C2]; 其中,C1∈R4×k,C2∈R3×k;Call∈R7×k是h=1和h=2这两种窗口大小的卷积核生成的特征映射的串联拼接;Wa∈Rk×k为卷积神经网络参数;是Wa的维度;Softmax·为Softmax函数;是自注意力矩阵;步骤2.3:根据所述自注意力矩阵计算所述原始事件的全部特征;采用下式计算得到原始事件的全部特征Call′: 步骤2.4:将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量;采用下式将原始事件的全部特征Call′中的元素展平,作为原始事件的特征向量F:F=FlattenCall′;其中,Flatten·是展平操作,Call′∈R7×k,F∈R7k,其中R7×k表示7行k列的二维向量,R7k表示包含7k个元素的一维向量;按照上述步骤2.1~2.4,分别使用卷积神经网络和注意力机制获取已知事件ei的特征向量和候选事件ecj的特征向量n、m分别为已知事件和候选事件的个数;使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件,具体包括:步骤4.1:根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率;采用下式将单个已知事件的特征向量和所有候选事件的特征向量之间的相似度进行串联拼接,生成单个已知事件对所有候选事件的预测概率Si:si=[si1;si2;...;sim];其中,sim是上下文已知事件ei和候选事件ecm之间的相似度;si∈Rm是第i个上下文已知事件ei和所有候选事件之间的相似度的串联拼接,将其作为单个已知事件ei对所有候选事件的预测概率;步骤4.2:根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率;采用下式将所有单个已知事件的预测概率s1,s2,...,sn进行串联拼接,生成所有已知事件对所有候选事件的预测概率s:s=[s1;s2;...;sn];S∈Rnm是所有si的串联拼接,将其作为所有已知事件对所有候选事件的预测概率;Rnm表示包含nm个元素的一维向量;步骤4.3:将所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;给定每个已知事件特征向量与每个候选事件特征向量之间的相似度sij,需要根据相似度从候选事件中选择出一个与所有已知事件特征最接近的事件;将所有相似度值S送入一个全连接网络,由此得到每个候选事件的概率pj:pj=sWf+bf;其中,Wf∈Rnm×m和bf∈Rn分别是全连接网络的权重和偏差项;Rnm×m表示nm行m列的二维向量;Rm表示包含m个元素的一维向量;pj∈Rm是候选事件ecj的概率;步骤4.4:选择最大概率对应的候选事件作为所述危机事件的预测事件;最后通过选择概率最大的候选事件作为危机事件的预测事件:epredict=argmaxpjargmaxpj表示选择将最大概率对应的候选事件返回,epredict为预测事件。

全文数据:

权利要求:

百度查询: 厦门大学 一种社交媒体危机事件预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。