首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于情感的文本分类处理方法、装置和计算机设备_平安科技(深圳)有限公司_201910042837.5 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-01-17

公开(公告)日:2024-06-21

公开(公告)号:CN109960725B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/289;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2021.02.12#实质审查的生效;2019.07.02#公开

摘要:本申请涉及一种基于情感的文本分类处理方法、装置和计算机设备。所述方法包括:获取情感分类任务,所述情感分类任务中包括待分类文本标识;根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。采用本方法能够有效的提高对文本进行情感分类的准确性。

主权项:1.一种基于情感的文本分类处理方法,所述方法包括:获取多个终端各自上传的情感分类任务,所述情感分类任务中包括待分类文本标识;对于每个所述待分类文本,根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及针对每个问题做出的对应的问题答复;根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型,不同的问题对应不同的子模型,每个问题对应一个子模型;根据问题与子模型之间的映射关系调用问题对应的子模型,将所述问题答复输入至相应的问题对应的子模型中,通过所述子模型对所述问题答复进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值,并输出所述问题对应的情感分值;根据所述多个问题中每个问题对应的权重,对相应的情感分值进行加权后累加,得到所述多个问题对应的情感总分值,根据所述情感总分值,识别所述待分类文本对应的情感类型;获取情感需求类型,将所述多个终端各自上传的待分类文本对应的情感类型分别与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度,根据所述第一匹配度筛选出符合预设条件的情感类型;获取多种产品信息,所述产品信息包括产品类型;将所述产品类型与筛选出的所述符合预设条件的情感类型进行匹配,得到对应的第二匹配度,将所述第二匹配度大于预定值的产品类型对应的产品信息标记为目标产品信息,提取所述筛选出的符合预设条件的情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。

全文数据:基于情感的文本分类处理方法、装置和计算机设备技术领域本申请涉及计算机技术领域,特别是涉及一种基于情感的文本分类处理方法、装置、计算机设备和存储介质。背景技术随着计算机技术的发展,计算机技术逐渐被应用到对文本的情感分类处理中。例如,在AIArtificialIntelligence,人工智能面试中,通过对面试者的回答进行情感分类处理,得到面试者的情感态度,以便企业根据需求对面试者进行筛选。再例如,在问卷调查中,对被调查者的回答进行情感分类处理,以了解被调查者的情感倾向。在传统方式中,通常是对采集到的所有文本统一进行情感分类。然而,在很多情况下,文本内容对应有不同的问题,不同的问题对情感的反映程度可能是不同的。对所有文本内容统一进行情感分类不能准确反映不同问题下的情感表达,从而导致情感分类结果出现不准确的情况。因此,如何提高情感分类的准确性成为目前需要解决的一个技术问题。发明内容基于此,有必要针对上述技术问题,提供一种能够提高情感分类准确性的基于情感的文本分类处理方法、装置、计算机设备和存储介质。一种基于情感的文本分类处理方法,所述方法包括:获取情感分类任务,所述情感分类任务中包括待分类文本标识;根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。在其中一个实施例中,所述将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,包括:将所述问题答复进行分词,得到多个词语;根据所述问题调用对应的子模型;利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。在其中一个实施例中,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:获取情感需求类型;将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;根据所述第一匹配度筛选出符合预设条件的情感类型;提取所述情感类型对应的主体信息。在其中一个实施例中,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:获取多种产品信息,所述产品信息包括产品类型;将所述产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当所述第二匹配度大于预定值时,将所述产品类型对应的产品信息标记为目标产品信息;提取所述情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。在其中一个实施例中,所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型,包括:获取每个问题对应的权重;根据所述权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据所述情感总分值识别所述待分类文本对应的情感类型。一种基于情感的文本分类处理装置,所述装置包括:任务获取模块,用于获取情感分类任务,所述情感分类任务中包括待分类文本标识;文本获取模块,用于根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;模型调用模块,用于根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;情感类型识别模块,用于根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。在其中一个实施例中,所述模型调用模块还用于将所述问题答复进行分词,得到多个词语;根据所述问题调用对应的子模型;利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。在其中一个实施例中,在所述情感类型识别模块之后,所述装置还包括:需求类型获取模块,用于获取情感需求类型;类型匹配模块,用于将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;情感类型筛选模块,用于根据所述第一匹配度筛选出符合预设条件的情感类型;信息提取模块,用于提取所述情感类型对应的主体信息。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。上述基于情感的文本分类处理方法、装置、计算机设备和存储介质,在获取到情感分类任务中的待分类文本标识后,根据待分类文本标识获取对应待分类文本中的多个问题以及每个问题对应的问题答复,调用情感分类模型中的多个子模型,对每个问题对应的问题答复逐一进行情感分类,根据得到的每个问题对应的情感分值识别待分类文本对应的情感类型。通过调用对应的子模型,针对每一个问题的具体情况,对问题答复逐一进行情感分类,再综合每个问题对应的情感分值识别待分类文本对应的情感类型。与传统方式中对所有文本统一进行情感分类相比,充分结合问题,对相应的问题答复进行情感分类,有效的提高了对文本进行情感分类的准确性。附图说明图1为一个实施例中基于情感的文本分类处理方法的应用环境图;图2为一个实施例中基于情感的文本分类处理方法的流程示意图;图3为一个实施例中根据情感类型提取主体信息的步骤的流程示意图;图4为一个实施例中基于情感的文本分类处理装置的结构框图;图5为另一个实施例中基于情感的文本分类处理装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的基于情感的文本分类处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104获取终端102发起的情感分类任务,情感分类任务中包括待分类文本标识,服务器104根据待分类文本标识获取对应的待分类文本,根据获取到的情感分类任务调用对应的情感分类模型。服务器104将待分类文本中的问题及问题答复输入情感分类模型的子模型中,通过子模型运算,输出问题对应的情感分值。服务器104根据多个问题对应的情感分值识别待分类文本对应的情感类型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种基于情感的文本分类处理方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:步骤202,获取情感分类任务,情感分类任务中包括待分类文本标识。服务器获取情感分类任务,对获取到的情感分类任务进行解析,得到情感分类任务中包括的待分类文本标识。该情感分类任务可由终端创建并上传至服务器。情感分类任务中包括了待分类文本标识,待分类文本标识指向对应的待分类文本。待分类文本标识可以包括多种类型。在其中一个实施例中,待分类文本标识可以是待分类文本的文件名。服务器可以执行情感分类任务,对待分类文本标识对应的待分类文本进行情感分类处理。步骤204,根据待分类文本标识获取对应的待分类文本,待分类文本包括多个问题以及对应的问题答复。服务器可以根据待分类文本标识获取对应的待分类文本。具体的,服务器可以获取待分类文本标识与待分类文本之间的映射关系,利用映射关系获取与待分类文本标识对应的待分类文本。待分类文本中包括多个问题以及对应的问题答复。其中,服务器可以针对不同用户提出不同问题,也可以对不同用户提出相同问题。问题答复是由用户针对每个问题对应做出的答复意见。例如,在人工智能面试过程中,可以针对不同的面试者提出不同的问题,并接收面试者的回答作为对应的问题答复,以避免面试者私下交流,更真实的反应面试者的应变能力。其中,提出问题的方式可以是多样的。服务器可以从预设问题中随机挑选问题进行提问,也可以根据面试者的回答挑选相关的问题进行提问。再例如,在问卷调查过程中,服务器可以针对不同的被调查者提出相同的问题,接收被调查者的问题答复,以了解被调查者对该些问题的情感倾向。步骤206,根据情感分类任务调用对应的情感分类模型,情感分类模型包括多个子模型。服务器可以根据情感分类任务调用对应的情感分类模型,情感分类模型是通过训练得到的用于对问题和问题答复文本进行情感分类的模型。其中,情感分类模型可以由多种分类模型训练得到,比如Fasttext模型。情感分类模型中包括多个子模型,不同的问题可以对应不同的子模型。服务器可以根据情感分类任务调用情感分类模型中问题对应的子模型对问题答复进行情感分类处理。步骤208,将问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出问题对应的情感分值。服务器将待分类文本中的问题以及对应的问题答复输入至对应的子模型中,调用子模型对问题答复进行情感分类。通过子模型的运算,输出该问题对应的情感分值。其中,情感分值可以反映针对问题的问题答复的情感倾向。具体的,服务器通过调用子模型进行运算,得到问题答复对应的各个情感标签的概率。根据对应的情感标签的概率进行计算,得到问题对应的情感分值,并输出该问题对应的情感分值。比如,利用Fasttext模型对待分类文本进行情感分类。服务器将待分类文本中的问题答复分别输入问题对应的Fasttext模型的子模型中,子模型对问题答复进行情感分类处理,得到多个情感标签对应的概率。例如情感标签可以包括积极和消极,该问题答复的情感分类结果为:积极概率68%,消极概率32%。根据问题答复的情感标签概率,计算出对应问题对应的情感分值,比如满分值10分时,情感分值为7分。步骤210,根据多个问题对应的情感分值识别待分类文本对应的情感类型。服务器综合多个问题对应的情感分值,根据多个问题对应的情感分值识别该待分类文本对应的情感类型,完成对待分类文本进行情感分类的情感分类任务。在本实施例中,在获取到情感分类任务中的待分类文本标识后,根据待分类文本标识获取对应待分类文本中的多个问题以及每个问题对应的问题答复,调用情感分类模型中的多个子模型,对每个问题对应的问题答复逐一进行情感分类,根据得到的每个问题对应的情感分值识别待分类文本对应的情感类型。通过调用对应的子模型,针对每一个问题的具体情况,对问题答复逐一进行情感分类,再综合每个问题对应的情感分值识别待分类文本对应的情感类型。与传统方式中对所有文本统一进行情感分类相比,充分结合问题,对相应的问题答复进行情感分类,有效的提高了对文本进行情感分类的准确性。在一个实施例中,根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤,包括:获取每个问题对应的权重;根据权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据情感总分值识别待分类文本对应的情感类型。服务器获取每个问题所对应的权重。由于每个问题对待分类文本的分类程度的重要性不同,为了均衡每个问题对情感分类程度的影响,每个问题都对应设置一个权重。用户可针对每个问题预先设置对应的重要性,服务器根据每个问题在所有问题中所占的重要性设置每个问题对应的权重。重要的问题所占的权重就可以高一些,简单的问题所占的权重就可以低一些。服务器根据权重和每个问题对应的情感分值进行计算,得到每个问题对应的修改后的分值。该修改后的分值可以客观体现对应的问题答复在待分类文本中的情感。例如,在面试过程中,可能会出现不同类型的问题,比如可以包括关于身份的问题、关于个人技能的问题和关于求职意向的问题等。在上述三类问题中,关于身份的问题所占的权重可以比关于个人技能和求职意向的问题所占的权重轻一些。因此,根据三类问题的问题答复的情感分值,需要结合问题对应的权重,重新进行计算,以得到问题对应的修改后的分值。服务器将计算得到的多个问题对应的修改后的分值进行累加,得到情感总分值。该情感总分值是综合了问题的待分类文本的情感总分值。服务器根据该情感总分值,识别待分类文本对应的情感类型,完成对待分类文本进行文本分类的情感分类任务。在本实施例中,服务器通过获取每个问题对应的权重,计算每个问题修改后的分值,利用累加多个问题对应的修改后的分值,得到的情感总分值,并通过情感总分值识别待分类文本对应的情感类型。通过结合每个问题对应的权重,解决了问题的重要性对最终情感类型的影响,有效的提高了对待分类文本进行情感分类的准确性。在一个实施例中,用户针对问题做出的答复意见可以包括多种形式。比如,可以包括文本形式和语音形式。服务器在收到答复意见时,可以判断答复意见的形式。若是文本形式,则直接将文本形式的答复意见作为问题答复,结合多个问题和问题答复生成待分类文本。若答复意见是语音形式的内容,服务器则将语音内容转换为文本形式的答复内容,并将该答复内容作为问题答复,生成待分类文本。在本实施例中,除了接收文本形式的问题答复,还可以接收语音形式的问题答复。通过将语音形式的问题答复转换为文本形式的问题答复,生成待分类文本,丰富了兼容的问题答复形式,便于用户采用多种形式做出问题答复。在一个实施例中,将问题以及对应的问题答复输入至对应的子模型,通过子模型运算的步骤,包括:将问题答复进行分词,得到多个词语;根据问题调用对应的子模型;利用子模型对词语进行情感分类,得到问题对应的情感分值。服务器可以采用多种方式对待分类文本中的问题答复进行分词,得到多个词语。具体的,服务器可以采用字符串匹配、理解、统计等方式中的一种或多种方式的结合对问题答复进行分词。其中,字符串匹配方式是指将问题答复与预设词典中的词条进行匹配,若在词典中找到该字符串,则认为匹配成功,即识别出一个词。字符串匹配的方式可以包括正向字符串匹配和逆向字符串匹配。理解方式是指服务器在对问题答复进行词语切割时进行语义分析和句法分析,利用语义信息和句法信息处理切割词语时出现的歧义情况。统计方式是指服务器对问题答复中相邻共现的字的组合的频度进行统计,根据他们的共现信息进行分词。在其中一个实施例中,服务器在分词时还可以引入N-gram向量。通过得到的向量特征确定对问题答复进行分词后的词语顺序,更加准确的体现问题答复的内容,有效的提高了对待分类文本情感分类的准确性。每个问题对应一个子模型。服务器获取问题与子模型之间的映射关系,根据映射关系调用问题对应的子模型。服务器将分词得到的多个词语输入子模型中,利用子模型对问题答复对应的词语进行情感分类,以得到问题对应的情感分值。在本实施例中,通过对问题答复进行分词,调用问题对应的子模型对得到的词语进行情感分类,得到了问题对应的情感分值。针对每一个问题的具体内容调用对应的子模型,得到问题对应的情感分值,有效的提高了对待分类文本进行情感分类的准确性。在一个实施例中,服务器在获取到待分类文本后,对待分类文本进行清理。比如删除不符合预设规则的待分类文本。再对清理之后的待分类文本进行情感分类。具体的,服务器将问题答复进行分词,得到多个词语后,根据问题调用对应的子模型。按照子模型的需要对多个词语进行整理,整理成子模型需要的数据形式。比如,服务器可以将词语整理成表格形式,再将表格形式的词语输入子模型中,利用子模型对问题答复进行情感分类,得到问题对应的情感分值。在本实施例中,获取到待分类文本后,对待分类文本进行清理,剔除不合法的待分类文本,并对分词得到的词语进行整理,得到符合子模型需求的数据形式,输入子模型中。有效的提高了对待分类文本的情感分类效率。在一个实施例中,在根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤之后,上述方法还包括:根据情感类型提取主体信息的步骤。如图3所示,该步骤具体包括:步骤302,获取情感需求类型。步骤304,将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度。步骤306,根据第一匹配度筛选出符合预设条件的情感类型。步骤308,提取情感类型对应的主体信息。服务器获取情感需求类型,其中,情感需求类型是指符合用户需求的情感类型。服务器可以采用多种方式将对待分类文本进行情感分类后得到的情感类型与情感类型进行匹配。具体的,服务器可以将分类后得到的情感类型逐一与情感需求类型进行匹配,还可以调用多个线程对情感类型的匹配并行处理。服务器将情感类型与情感需求类型进行匹配后,得到该情感类型对应的第一匹配度。服务器对多个情感类型对应的第一匹配度进行筛选,筛选出符合预设条件的情感类型。其中,预设条件可以是由用户预先设置的条件,比如筛选出第一匹配度大于一个定值的情感类型。服务器提取符合预设条件的情感类型对应的主体信息,以得到符合情感需求类型的主体信息。例如,在智能面试中,服务器将面试者提供的待分类文本进行情感分类后得到该面试者对应的情感类型,服务器可以获取招聘岗位的情感需求类型,将面试者们的情感类型与岗位的情感需求类型进行匹配,得到多个面试者们对应的第一匹配度。服务器根据第一匹配度进行筛选,筛选出第一匹配度符合预设条件的情感类型,该情感类型即是符合岗位情感需求类型的。服务器提取符合条件的情感类型对应的主体信息,得到符合条件的主体信息。通过从多个面试者的情感类型中筛选出与岗位情感需求类型匹配的面试者的主体信息,从多个面试者中根据情感类型初步筛选出符合招聘岗位需求的面试者,有效的提高了面试效率和准确性。在本实施例中,通过将情感类型与情感需求类型进行匹配,根据第一匹配度筛选出符合预设条件的情感类型,有效的利用情感类型进行满足需求的筛选,得到符合需求的主体信息,有效的丰富了目标筛选方式,提高了筛选效率。在一个实施例中,在根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤之后,上述方法还包括:获取多种产品信息,产品信息包括产品类型;将产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当第二匹配度大于预定值时,将产品类型对应的产品信息标记为目标产品信息;提取情感类型对应的终端标识,将目标产品信息推送至终端标识对应的终端。服务器获取多种产品对应的产品信息,产品信息中包括了对应的产品类型。多种产品中可以包括不同产品类型的产品。例如,在基金类产品中,包括高风险高收益型产品,也包括低风险低收益型产品。服务器可以采用多种方式将多种产品的产品类型与分类后的情感类型进行匹配。具体的,服务器可以将多种产品对应的产品类型依次与情感类型进行匹配,也可以调用多个线程对产品类型与情感类型并行处理,得到对应的第二匹配度。当第二匹配度大于预定值时,将该产品类型对应的产品信息标记为目标产品信息。其中,预定值是由用户预先设定的值。当第二匹配度大于预定值时,则表示该产品类型对应的产品与该情感类型对应的用户是相匹配的。例如,高风险高收益型产品与偏向冒险型的用户比较匹配,低风险低收益型产品与偏向保守型的用户比较匹配。服务器提取情感类型对应的终端标识,将该目标产品信息推送至终端标识对应的终端,完成符合情感类型匹配的产品信息推送。在本实施例中,通过将产品类型与用户的情感类型进行匹配,为用户推送符合用户情感类型的目标产品信息,有效的提高了对应信息推送的准确性。可以理解的是,在一个实施例中,在获取多种产品信息,将产品类别与情感类型进行匹配之前,还可以获取情感需求类型,将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度,根据第一匹配度筛选出符合预设条件的情感类型。服务器再将多种产品类型与筛选出的情感类型进行匹配,得到对应的第二匹配度,将第二匹配度大于预定值的产品类型对应的产品信息标记为目标产品信息,将目标产品信息推送至情感类型对应的终端。服务器可以利用情感类型对用户进行筛选,筛选出符合情感需求类型的用户。例如,服务器可以根据情感类型筛选出对购买产品有积极意向的用户,再将产品类型与筛选出的用户的情感类型进行匹配,从多种产品类型中筛选出符合用户情感类型的产品类型。到达给有购买意向的用户推送符合用户情感类型的产品信息的效果。在本实施例中,将对情感类型进行筛选和对产品类型进行筛选相结合,有效的提高了产品信息推送的效率和准确性。在一个实施例中,服务器建立通用情感分类模型,通用情感分类模型可以采用Fasttext模型。服务器接收训练集数据,其中,训练集数据中可以包括多个训练文本,训练文本中包括目标问题、目标问题对应的问题答复以及问题答复对应的目标情感分值。每个目标问题可以对应多个问题答复和对应的目标情感分值。服务器可以利用训练集数据对通用情感分类模型进行训练。具体的,服务器调用目标问题对应的通用情感分类模型中的子模型,将对应的问题答复输入子模型中,通过子模型运算,输出训练情感分值。服务器可以将训练情感分值与目标情感分值进行比对,根据比对结果对相应的子模型进行调整。调整后重复将问题答复输入对应的子模型中,对子模型进行调整,直到训练情感分值与目标情感分值比对成功,即得到了该目标问题对应的目标子模型。服务器利用多个训练文本中的目标问题、问题答复以及目标情感分值对多个子模型进行训练,以得到目标情感分类模型。在本实施例中,通过利用训练集数据对通用情感分类模型进行训练,得到目标情感分类模型,有效的提高了目标情感分类模型的准确度。应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图4所示,提供了一种基于情感的文本分类处理装置,包括:任务获取模块402、文本获取模块404、模型调用模块406和情感类型识别模块408,其中:任务获取模块402,用于获取情感分类任务,情感分类任务中包括待分类文本标识。文本获取模块404,用于根据待分类文本标识获取对应的待分类文本,待分类文本包括多个问题以及对应的问题答复。模型调用模块406,用于根据情感分类任务调用对应的情感分类模型,情感分类模型包括多个子模型;将问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出问题对应的情感分值。情感类型识别模块408,用于根据多个问题对应的情感分值识别待分类文本对应的情感类型。在一个实施例中,上述模型调用模块406还用于将问题答复进行分词,得到多个词语;根据问题调用对应的子模型;利用子模型对词语进行情感分类,得到问题对应的情感分值。在一个实施例中,如图5所示,在上述情感类型识别模块408之后,上述基于情感的文本分类处理装置还包括:需求类型获取模块502,用于获取情感需求类型。情感类型匹配模块504,用于将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度。情感类型筛选模块506,用于根据第一匹配度筛选出符合预设条件的情感类型。主体信息提取模块508,用于提取情感类型对应的主体信息。在一个实施例中,在上述情感类型识别模块408之后,上述基于情感的文本分类处理装置还包括产品信息推送模块,用于获取多种产品信息,产品信息包括产品类型;将产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当第二匹配度大于预定值时,将产品类型对应的产品信息标记为目标产品信息;提取情感类型对应的终端标识,将目标产品信息推送至终端标识对应的终端。在一个实施例中,上述情感类型识别模块408还用于获取每个问题对应的权重;根据权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据情感总分值识别待分类文本对应的情感类型。关于基于情感的文本分类处理装置的具体限定可以参见上文中对于基于情感的文本分类处理方法的限定,在此不再赘述。上述基于情感的文本分类处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于情感的文本分类处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于情感的文本分类处理方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和或易失性存储器。非易失性存储器可包括只读存储器ROM、可编程ROMPROM、电可编程ROMEPROM、电可擦除可编程ROMEEPROM或闪存。易失性存储器可包括随机存取存储器RAM或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAMSRAM、动态RAMDRAM、同步DRAMSDRAM、双数据率SDRAMDDRSDRAM、增强型SDRAMESDRAM、同步链路SynchlinkDRAMSLDRAM、存储器总线Rambus直接RAMRDRAM、直接存储器总线动态RAMDRDRAM、以及存储器总线动态RAMRDRAM等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

权利要求:1.一种基于情感的文本分类处理方法,所述方法包括:获取情感分类任务,所述情感分类任务中包括待分类文本标识;根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。2.根据权利要求1所述的方法,其特征在于,所述将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,包括:将所述问题答复进行分词,得到多个词语;根据所述问题调用对应的子模型;利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。3.根据权利要求1所述的方法,其特征在于,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:获取情感需求类型;将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;根据所述第一匹配度筛选出符合预设条件的情感类型;提取所述情感类型对应的主体信息。4.根据权利要求1-3中任一项所述的方法,其特征在于,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:获取多种产品信息,所述产品信息包括产品类型;将所述产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当所述第二匹配度大于预定值时,将所述产品类型对应的产品信息标记为目标产品信息;提取所述情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。5.根据权利要求1所述的方法,其特征在于,所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型,包括:获取每个问题对应的权重;根据所述权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据所述情感总分值识别所述待分类文本对应的情感类型。6.一种基于情感的文本分类处理装置,其特征在于,所述装置包括:任务获取模块,用于获取情感分类任务,所述情感分类任务中包括待分类文本标识;文本获取模块,用于根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;模型调用模块,用于根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;情感类型识别模块,用于根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。7.根据权利要求6所述的装置,其特征在于,所述模型调用模块还用于将所述问题答复进行分词,得到多个词语;根据所述问题调用对应的子模型;利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。8.根据权利要求6所述的装置,其特征在于,在所述情感类型识别模块之后,所述装置还包括:需求类型获取模块,用于获取情感需求类型;类型匹配模块,用于将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;情感类型筛选模块,用于根据所述第一匹配度筛选出符合预设条件的情感类型;信息提取模块,用于提取所述情感类型对应的主体信息。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。

百度查询: 平安科技(深圳)有限公司 基于情感的文本分类处理方法、装置和计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。