首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于异质图注意力网络的社交用户抑郁倾向检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东工业大学

摘要:本发明公开了一种基于异质图注意力网络的社交用户抑郁倾向检测方法,包括下述步骤:采集用户社交网络平台上的数据,对于用户生成内容的短文本进行文本摘要,对于用户行为数据和用户画像数据进行统计计算;构建一个灵活的异质信息网络框架对短文本、用户行为数据和用户画像数据进行建模,对处理好的短文本进行实体链接、实体嵌入和特征提取,并对特征进行主题分析;对于不同类型信息的异质性,使用异质图卷积;对于不同相邻节点的重要性和不同节点类型对特定节点的重要性,建立基于类型级和节点级的双层注意力机制;构建一个基于注意力机制的异质图神经网络,对网络进行训练和测试,预测标签,从而完成判断用户是否存在抑郁倾向的分类任务。本发明能够结合多个信息维度将社交媒体数据建模为异质图结构,并构建异质图注意力网络进行半监督分类,判断用户是否存在抑郁倾向,有利于帮助提高诊断的有效性,从而辅助临床确诊。

主权项:1.一种基于异质图注意力网络的社交用户抑郁倾向检测方法,其特征在于,包括以下步骤:S1、采集用户社交网络平台上的数据,对于用户生成内容的短文本进行文本摘要,对于用户行为数据和用户画像数据进行统计计算;S2、构建一个灵活的异质信息网络框架对短文本、用户行为数据和用户画像数据进行建模,对处理好的短文本进行实体链接、实体嵌入和特征提取,并对特征进行主题分析;为了解决短文本的语义稀疏性问题,我们利用一个灵活的异质信息网络HeterogeneousInformationNetwork,HIN框架来对短文本进行建模,该框架可以集成任何类型的附加信息,并捕获它们之间的关系,以丰富短文本的语义,对于附加信息,除了主题和实体,我们还用到步骤S1计算的用户行为数据和用户画像数据,如发送时间分布、用户使用积极和消极词汇比例的统计等,构造图G=V,ε,V,ε分别为节点集和边集,其中节点集包括短文本集D={d1,…,dm}、主题集T={t1,…,tk}、实体集E={e1,...,en}、发送时间分布集C={c1,…,cp}、词汇比例集W={w1,…,wq},即V=D∪T∪E∪C∪W,边集ε表示它们之间的关系;使用文档主题生成模型LatentDirichletAllocation来识别短文本中潜藏的主题信息,挖掘出隐含主题,以丰富短文本的语义,计算词频,每个主题ti=θ1,...,θw,w表示词汇量由单词的概率分布表示,为每个文档分配前P个概率最高的主题,若存在文档与主题的分配关系,则“文档-主题”边建立;对短文本进行实体链接,识别文档D中的实体E,并使用实体链接工具TAGME将它们映射到Wikipedia,若文档包含实体,则“文档-实体”边建立;对短文本进行实体嵌入,将一个实体作为一个完整的词,并使用基于Wikipedia语料库的word2vec2来学习实体嵌入,为了进一步丰富短文本的语义并促进信息传播,增加了实体之间的关系的考虑,如果基于嵌入计算的两个实体之间的相似度得分余弦相似度高于预定义的阈值δ,则“实体-实体”边建立;建立与用户行为数据和用户画像数据相关的边,包括每一个时间分布都对应每一个用户,每一个词汇比例都对应每一个用户,建立“时间分布-文档”边、建立“词汇比例-文档”边;将词频率、逆文档频率TF-IDF作为特征,并删掉没有特征的实体、删掉一些边、删掉孤立点,分别生成边特征的文件,包括文档节点、实体节点、主题节点、用户行为数据节点、用户画像数据节点,同时保存map索引信息文件,以待输入网络训练;S3、对于不同类型信息的异质性,使用异质图卷积;S4、对于不同相邻节点的重要性和不同节点类型对特定节点的重要性,建立基于类型级和节点级的双层注意力机制;S5、构建一个基于注意力机制的异质图神经网络,对网络进行训练和测试,预测标签,从而完成判断用户是否存在抑郁倾向的分类任务。

全文数据:

权利要求:

百度查询: 广东工业大学 一种基于异质图注意力网络的社交用户抑郁倾向检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术