首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于自然语言识别的信息处理方法、相关设备及存储介质 

申请/专利权人:腾讯科技(深圳)有限公司

申请日:2019-06-27

公开(公告)日:2024-06-28

公开(公告)号:CN110334347B

主分类号:G06F40/20

分类号:G06F40/20;G06F40/30;G06F40/40;G06F16/33;G06F16/36;G06F3/01;G10L15/26

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.10.26#实质审查的生效;2019.10.15#公开

摘要:本申请实施例公开了一种基于自然语言识别的信息处理方法、相关设备及存储介质,其中基于自然语言识别的信息处理方法包括:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行意图识别,得到意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据应答信息执行相应操作。本申请方案通过结合上下文环境对目标对象输入的自然语言信息进行意图识别,并根据不同的匹配意图进行相关操作,提升了自然语言识别的准确性、及运维时解决问题的效率。

主权项:1.一种基于自然语言识别的信息处理方法,其特征在于,包括:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行分词处理,得到多个候选词;基于预设知识库对多个候选词进行检索,得到与每一候选词匹配的样本词、及候选词与样本词之间的匹配度;从所述样本词中确定对应匹配度低于第一阈值的第一样本词;将所述第一样本词替换所述多个候选词中与其匹配的候选词;从所述样本词中确定对应匹配度低于第二阈值的第二样本词,其中,所述第一阈值大于所述第二阈值;将所述多个候选词中与所述第二样本词匹配的候选词删除;基于更新后的候选词生成意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。

全文数据:基于自然语言识别的信息处理方法、相关设备及存储介质技术领域本申请涉及信息处理技术领域,具体涉及一种基于自然语言识别的信息处理方法、相关设备及存储介质。背景技术随着互联网的兴起和移动通信网络的发展,ITInformationTechnology,信息技术运维已经成为IT服务中重要的组成部分。相关技术中,由于任务耦合性较高,尤其是遇到复杂的、大型的系统,则可能难以识别用户输入的问题,导致对基于自然语言识别的信息处理的准确度较低。使得在通过基于自然语言识别的信息处理进行运维时,无法有效解决出现的问题。发明内容本申请实施例提供一种基于自然语言识别的信息处理方法、相关设备及存储介质,可提升自然语言识别的准确性、及运维时解决问题的效率。本申请实施例提供了一种基于自然语言识别的信息处理方法,包括:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行意图识别,得到意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。相应的,本申请实施例还提供了一种基于自然语言识别的信息处理装置,包括:获取单元,用于获取待识别的自然语言信息;修整单元,用于根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;识别单元,用于识别对修整后的自然语言信息进行意图识别,得到意图识别结果;处理单元,用于基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。相应的,本申请实施例还提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述基于自然语言识别的信息处理方法中的步骤。相应的,本申请实施例还提供了一种终端,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述基于自然语言识别的信息处理方法中的步骤。本申请方案通过获取自然语言信息的上下文信息对该自然语言信息进行修整,并对修整后的自然语言信息进行意图识别。其通过结合上下文语境对用户输入的自然语言信息进行意图识别,提升了自然语言识别的准确性,使意图识别结果更加精准、有效。进而在根据意图识别结果匹配应答信息时,提升应答信息的匹配成功率,从而可基于匹配到的应答信息准确执行相应操作实现运维处理,提升运维时解决问题的效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的基于自然语言识别的信息处理方法的一流程示意图。图2是本申请实施例提供的基于自然语言识别的信息处理方法的另一流程示意图。图3是本申请实施例提供的一种算法模型的示意图。图4是本申请实施例提供的基于自然语言识别的信息处理方法的一系统架构示意图。图5是本申请实施例提供的自然语言识别模块的示意图。图6是本申请实施例提供的基于自然语言识别的信息处理方法的另一系统架构示意图。图7是本申请实施例提供的基于自然语言识别的信息处理装置的结构示意图。图8是本申请实施例提供的终端的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例提供一种基于自然语言识别的信息处理方法、相关设备及存储介质,可提升自然语言识别的准确性、及运维时解决问题的效率。以下分别进行详细说明。需说明的是,以下实施例的顺序不作为对实施例优选顺序的限定。在一实施例中,将以该第一基于自然语言识别的信息处理装置集成在终端中的角度进行描述。请参阅图1,图1为本申请实施例提供的基于自然语言识别的信息处理方法的一种流程示意图。该基于自然语言识别的信息处理方法的具体流程可以如下:101、获取待识别的自然语言信息。其中,自然语言指一种自然地随文化演化的语言,是人类交流和沟通的主要工具、及人机交互的工具。例如,英语、汉语、日语等都属于自然语言。在本实施例中,该待识别的自然语言信息可以是用户输入的信息。具体实施时,用户可通过终端设备的信息输入接口输入自然语言信息。例如,该终端设备可展示一信息输入界面,该信息输入界面设置有信息输入控件,用户可通过该信息输入控件输入自然语言信息,以实现与设备之间的人机交互。实际应用中,用户在输入该待识别的自然语言信息时,可以多种输入方式例如,可以文本信息的方式输入,也可以语音信息的方式输入。相应的,设备接收到的可以是以文本信息形式呈现的自然语言信息,也可以是以语音信息形式呈现的自然语言信息。102、根据相关信息对待识别的自然语言信息进行修整,其中,相关信息为待识别的自然语言信息的上文信息和或下文信息。其中,该待识别自然语言信息的上文信息、下文信息的性质,与待识别的自然语言信息的性质相同。即,该上文信息、下文信息也为用户输入的自然语言信息。上文信息为在该待识别的自然语言之前由用户输入到终端设备的信息;下文信息为在该待识别的自然语言之后由用户输入到终端设备的信息。例如,用户通过终端设备依次输入语句1、语句2和语句3,则对于语句2而言,语句1为语句2的上文信息,语句3为语句2的下文信息;对于语句3而言、语句1和语句2都为语句3的上文信息;对于语句1而言,语句2和语句3都为语句1的下文信息。具体的,根据待识别的自然语言信息的上文信息和或下文信息,对待识别的自然语言信息进行修整。实际应用中,用户在一定时间段内输入信息之间通常是具体关联性的,因此可基于整体语境来进行语义提取。也即,可基于当前待识别语句即待识别的自然语言信息的上下文对该待识别语句进行调整、修改,使得当前语句想要表达的意图更加清晰,以供后续的语句意图识别。本申请实施例中,对自然语言信息进行修整的方式可以有多种。参考图2,在一些实施例中步骤“根据相关信息对待识别的自然语言信息进行修整”,可以包括以下流程:1021、确定相关信息的语义结构;1022、基于语义结构对待识别的自然语言信息进行修整。其中,语义即语言的含义,是数据在某个领域上的解释和逻辑表示。在成分方面,语义结构有施事、受事、谓词等成分。语义结构的最小单位是语义词,最大单位是义句。在本实施例中,语义结构可以包括上下文信息中其中一条语句的语义结构,也可以是其中多条语句的语义结构。另外,还可以是多条语句混合后的语义结构,例如,通过终端设备将一句话分多次输入的情况。具体的,在基于相关信息的语义结构对待识别的自然语言信息进行修整时,可以有多种方式。例如,在一些实施例中,语义结构可以包括关键词、及关键词之间的关联关系。则,步骤“基于语义结构对待识别的自然语言信息进行修整”,可以包括以下流程:11基于关键词对待识别的自然语言信息进行信息填充;12基于关联关系对填充后的自然语言信息进行语序调整。例如,在用户首先输入“查询IP1的流量”,待收到相关应答信息后,再输入“IP2的呢”。很明显,IP2也是需要查询流量。因此,可以基于历史的信息输入,对当前的自然语言信息进信息填充,以完善当前输入请求。仍以上述“IP2的呢”为例,则可以从上文信息“查询IP1的流量”中提取“查询”和“流量”,对“IP2的呢”进行信息填充。然后,基于上文信息中关键词之间的关联关系,信息填充后的语句进行语序调整,得到完整的语句。例如,以“IP2的呢”为例,进行信息填充和语序调整后可以为“查询IP2的流量呢”。而实际应用中,对于一个自然语句的理解应该依赖于上下文环境。如果不仅仅依赖上文信息或者下文信息,会导致预测的准确性降低。因此,通常会将待识别信息与其上下文信息拼接成一个输入序列,并采用RNNRecurrentNeuralNetwork,循环神经网络模型对该拼接的序列进行编码,以在解码阶段基于全文即上下文信息及待识别信息生成应答信息。然而,将上下文信息全部拼接成一个输入序列,通常会导致序列过长,使得序列效果会变差。有基于此,参考图3,本方案中将采用双向的RNN模型来进行序列的编码解码。该双向的RNN模型中,每一个训练序列会被表达成前向和后向两种单独的循环网络,它们都被连接到同一个输出层。具体实施时,首先将上下文信息作为单独的句子如图3中语境S1、语境S2、语境S3……输入消息M,用第一级RNN对每个单词进行编码形成每个句子的中间表示,而第二级RNN则将第一级RNN的中间表示结果,按照上下文中句子出现先后顺序序列再进行编码,然后在解码阶段参考上下文信息输出每个单独的句子对应的应答信息如图3所示的应答信息Y1、Y2、Y3。可知,本方案中通过双向的RNN模型,在编码阶段把待识别信息与上下文信息同时编码,促使解码阶段可以参考上下文语境生成应答信息,无需将上下文信息合并成垄长的序列,也可实现上下文信息与当前输入信息的结合。因此,本方案中采用双向的RNN模型进行序列的编码解码,可避免因上下文全部拼接后导致输入过长,使得序列效果会变差的问题。在一些实施例中,步骤“确定相关信息的语义结构”可以包括以下流程:确定相关信息中各词语的词性和位置信息;基于词性和位置信息,生成相关信息中每个词语之间的关联关系。具体的,确定上下文信息的语义结构时,可基于每一语句中词语的词性、以及各词语之间的位置关系,生成词语之间的关联关系。103、对修整后的自然语言信息进行意图识别,得到意图识别结果。具体的,在对待识别的自然语言信息修整完善之后,可对其进行意图识别。继续参考图2,在一些实施例中,步骤“对修整后的自然语言信息进行意图识别,得到意图识别结果”,可以包括以下流程:1031、对修整后的自然语言信息进行分词处理,得到多个候选词;1032、基于预设知识库对多个候选词进行检索,得到检索结果;1033、根据检索结果对所述多个候选词进行更新;1034、基于更新后的候选词生成意图识别结果。具体的,在进行分词处理时可以是基于统计的分词,统计的样本内容来自于标准的语料库。具体实施时,可利用语料库建立的统计概率,对于一个新的句子,可以通过计算各种分词方法对应的联合分布概率,找到最大概率对应的分词方法,即为最优分词,从而得到多个候选词。其中,该预设知识库可分为两种,一种是普适知识库,包括相似词、纠错等;另一种为基于本领域运维的关键词、关键问题匹配。在一些实施例中,检索结果包括:与每一候选词匹配的样本词、及候选词与样本词之间的匹配度;则步骤“根据检索结果对所述多个候选词进行更新”,可以包括以下流程:21从样本词中确定对应匹配度低于第一阈值的第一样本词;22将第一样本词替换所述多个候选词中与其匹配的候选词;23从样本词中确定对应匹配度低于第二阈值的第二样本词,其中,第一阈值大于第二阈值;24将多个候选词中与第二样本词匹配的候选词删除。其中,样本词可以存在于上述预设知识库内。具体的,为了提升数据的有效性,可对一些无效的数据筛除、调整。例如,对一些停用词、错词的处理。具体实施时,对于错词如错别字,可认为是与预设知识库中存在一定匹配度但匹配度又不是很高的词,故可基于匹配度高低筛选出这一类候选词,并用预设知识库中匹配到的样本词对该候选词进行替换,以实现词语的纠错操作。对于停用词,也即从预设知识库中匹配不到相应的样本词。因此,可在进行词语检索时,可将匹配度相当低的候选词认为是停用词,故可将该候选词去除以提升数据的有效性。在一些实施例中,步骤“基于更新后的候选词生成意图识别结果”,可以包括以下流程:31从更新后的候选词中识别实体;32确定实体所属的实体类型;33基于实体、实体类型及候选词,生成意图识别结果。在本实施例中,对自然语言进行意图识别时,包括分词、停用词处理、需求分析、主干分析、实体识别、关键词纠错等,然后将自然语言转换为向量,供后续进行相似度计算。实际应用中,可以运维知识库作为载体,将用户输入的信息在知识库知识库中进行检索,召回,计算与各个可能匹配的意图的相似度,输出意图词、实体、相似度、实体类型等关键信息。104、基于意图识别结果从指定的应答信息库中获取对应的应答信息,并根据应答信息执行相应操作。在一些实施例中,意图识别结果可以包括:意图词、实体、实体类型;则步骤“基于意图识别结果从指定的应答信息库中获取对应的应答信息”,可以包括以下流程:根据实体类型从多个预设的意图图谱中获取目标意图图谱,其中,目标意图图谱中至少包括:与实体关联的关联数据;基于意图词、实体、及关联数据,从指定的应答信息库中获取对应的应答信息。具体的,真实的原始语料中,绝大部分数据为非结构化的数据。例如,非结构化信息如下:文章1{段落1,段落2,段落3……}文章2{段落1,段落2,段落3……}结构化信息如下:哺乳动物{猫,狗……}温血动物{哺乳动物}由于机器识别更多的能够处理结构化的数据。因此,在本实施例中,可将运维系统的知识库作为输入,将运维系统的知识进行整合、总结出来各个概念之间的关联关系,构建基于运维的知识图谱。然后,将通用的意图和执行的命令变成调用库形成意图图谱,以低成本构建一个覆盖通用场景的聊天机器人。例如,在运维系统中,会总结出来如kafka{broker,topic,isr…}关联关系的数据。通过知识库的配置,管理,将运维系统的知识进行整合,可以构建出知识的轮廓。通过归纳总结,可以获取到broker是kafka的一个列表,如用户输入的问题是“broker的列表是多少”,而预置的问答对是“kafka列表是多少”。通过意图图谱,可以知道broker为kafka的一个节点,用户很有可能是问的问题是“kafka中broker列表是多少”。继续参考图2,在一些实施例中,步骤“基于意图识别结果从指定的应答信息库中获取对应的应答信息,并根据应答信息执行相应操作”,可以包括以下流程:1041、根据意图识别结果从指定的应答信息库中获取对应的应答信息;1042、获取应答信息的内容;1043、根据内容确定应答信息所属的任务类型;1044、基于任务类型和应答信息执行相应操作。具体的,可基于应当信息的具体内容,来确定所属的任务类型。例如,应答信息为针对查询类的任务,则将基于查询类和该应答信息将应答信息,在当前终端设备中的人机交互界面中展示。又例如,应答信息为针对执行类的任务,则调用相应的进程执行该应答信息所指示的指令。另外,在本申请中,在意图未识别时,可以根据匹配进行联想,引导用户进行更加细致的提问来保证回复的准确性。例如,查询直播播放质量,通过当前时间,查询到从0点到当前时间的直播播放质量,通过网页截屏的方式将图片保存下来。从而可以实时查看直播播放质量、错误率、播放在线人数等信息。图片可以保存下来进行局部放大,查询具体的细节。如果查询语句中带参数,如查询昨天的直播播放质量,则会根据时间维度,查询昨天的播放质量进行截图呈现在人机交互窗口。本实施例提供的基于自然语言识别的信息处理方法,通过结合上下文环境对用户输入的自然语言信息进行意图识别,提升了自然语言识别的准确性,使意图识别结果更加精准、有效;另外,通过自然语言的识别进行任务的分解分发,能够准确地对用户输入进行提取,进而在根据意图识别结果匹配应答信息时,提升应答信息的匹配成功率,从而可基于匹配到的应答信息准确执行相应操作实现运维处理,提升了运维时解决问题的效率。参考图4,图4为本申请实施例提供的基于自然语言识别的信息处理方法的系统架构图。本系统的输入是用户所需要查询或者执行命令,经过自然语言处理和识别,由意图图谱获取到用户输入意图,经过中控系统,通过异步调用执行对应的命令和操作,可实现多种操作的同时进行,避免服务堵塞。其中,该操作包括但是不限于查询数据,执行指令、知识图谱的查询等。参考图5,图5为本申请实施例提供的自然语言提取模块的示意图。本实施例构建了以自然语言理解为核心的中控系统,将用户输入的信息作为自然语言的输入,经过NLP处理识别用户的意图,并根据用户的意图进行命令执行。用户信息输入之后,经过RootMerge模块,将知识问答、垂类、知识图谱问答、和闲聊等四部分自然语言处理能力汇总起来进行分析,输出意图识别。其中,RootMerge模块是一个自然语言识别的控制系统,对接知识问答、NLP、闲聊等专业的自然语言处理模块,管理用户会话控制、进行多轮控制等。意图识别之后,根据用户想要执行的操作,通过统一调用异步接口进行查询类、执行类等相关任务的操作。参考图6,图6中的NLUNaturalLanguageUnderstanding,自然语言理解模块包括分词,停用词处理,需求分析,主干分析,实体识别,关键词纠错等功能,将自然语言转换为向量,供后续进行相似度计算。意图词槽识别是本系统的核心,以运维知识库作为载体,将用户输入的信息在知识库知识库中进行检索、召回,并计算与各个可能匹配的意图的相似度。然后输出词槽、实体、相似度、实体识别类型等关键信息。其中,知识库分为两种,一是普适知识库,包括相似词、纠错等;另一种为基于本领域运维的关键词、关键问题匹配。继续参考图6,“打分”是将意图识别后的向量进行规则,合并、丢弃相似度低的数据,输出0-1之间的分数。其中,分数越高,则表明越接近于用户的需求。“重排”则是根据用户的打分进行重新排序,输出关联度由高到低的记录。通过意图词槽识别,克服了自然语言中关键信息提取的问题。在实际应用中,通常用户的预置问题和实际问题文字不一样,但是所表达的含义是是一样的。针对问法的差异,可以通过同义词、知识库匹配来进行纠正,可以大大提升识别的准确性。在具体实施时,可通过编码-解码模型对问题进行扩充,将原来相近的问法作为模型的输入进行编码,输入语音库时,进行解码,将问题进行扩展。例如,可采用Seq2Seq模型进行问题集的扩充。在一些实施例中,以上述系统架构为运维系统为例,可以根据用户所属部门,所涉及的领域、人来构建初始化模型。如大数据领域,则所提问题肯定是HDFSSparkKafkaZookeeper相关的问题;如果是服务器运维管理,则更加偏向于流量、网络、磁盘等。根据不同的部门如可将数据分析、后台开发等作为前置条件输入,通过逻辑回归设定一个可能的知识图谱的范围,作为后续自然语言判断的基础。本系统致力于提高自然语言的识别准确性,由于运维无小事,不能出现输入如重机器,结果执行为重启机器这种问题,会带来非常大的麻烦和后果。为了保证运维系统的安全性、高危操作增加二次确认。如果识别不清楚的地方,可采用反问澄清的方式来增加识别的精准度。本系统以知识库为基础的语义识别系统,通过数据的理解,挖掘,语义的分析来识别用户意图。因此本系统中最核心的部分是数据,数据分为两部分,一部分是在线数据或者是外部数据。另一部分是日志数据,用户在使用过程中的问法和反馈。外部数据的扩充是通过不同的爬虫来拉取,并及时进行数据更新,通过问法汇聚,扩充问法,阅读理解生产问题答案等方式来进行模型训练和规则生成。内部数据以反馈和日志记录为主,用户输入一个命令,不管有没有匹配,都会记录日志,本系统定期将这些日志汇总,通过歧义问题合并,离群问题识别等方式,来进行归纳和整理,根据整理结果,输入基于先验规则的知识,进行模型更新,保证可以及时回复用户的问题。本申请中,能够通过自然语言的识别,来进行任务的分解分发,能够准确地对用户输入进行提取,并进行执行,同时解决了上下文依赖的问题,可以根据环境,上下文的输入来填充信息,将识别的场景进行定制化,提升了识别的准确度;另外,克服了语义、顺序不一致,但是表述内容相同时,普通规则匹配非常复杂的难题。为便于更好的实施本申请实施例提供的基于自然语言识别的信息处理方法,本申请实施例还提供一种基于上述基于自然语言识别的信息处理方法的装置。其中名词的含义与上述基于自然语言识别的信息处理方法中相同,具体实现细节可以参考方法实施例中的说明。请参阅图7,图7为本申请实施例提供的一种基于自然语言识别的信息处理装置的结构示意图。其中,该基于自然语言识别的信息处理装置400可以集成在终端中。该基于自然语言识别的信息处理装置400可以包括指令获取单元401、修整单元402、识别单元403、及处理单元404,具体可以如下:获取单元401,用于获取待识别的自然语言信息;修整单元402,用于根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;识别单元403,用于识别对修整后的自然语言信息进行意图识别,得到意图识别结果;处理单元404,用于基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。在一些实施例中,修整单元402可以包括:确定子单元,用于确定所述相关信息的语义结构;修整子单元,用于基于所述语义结构对待识别的自然语言信息进行修整。在一些实施例中,所述语义结构包括关键词、及所述关键词之间的关联关系;所述修整子单元可以用于:基于所述关键词对待识别的自然语言信息进行信息填充;基于所述关联关系对填充后的自然语言信息进行语序调整。在一些实施例中,确定子单元可以用于:确定所述相关信息中各词语的词性和位置信息;基于所述词性和位置信息,生成所述相关信息中每个词语之间的关联关系。在一些实施例中,识别单元403可以包括:处理子单元,用于对所述修整后的自然语言信息进行分词处理,得到多个候选词;检索子单元,用于基于预设知识库对多个候选词进行检索,得到检索结果;更新子单元,用于根据所述检索结果对所述多个候选词进行更新;生成子单元,用于基于更新后的候选词生成意图识别结果。在一些实施例中,生成子单元可以用于:从更新后的候选词中识别实体;确定所述实体所属的实体类型;基于所述实体、所述实体类型及所述候选词,生成意图识别结果。在一些实施例中,检索结果可以包括:与每一候选词匹配的样本词、及候选词与样本词之间的匹配度;所述更新子模块可以用于:从所述样本词中确定对应匹配度低于第一阈值的第一样本词;将所述第一样本词替换所述多个候选词中与其匹配的候选词;从所述样本词中确定对应匹配度低于第二阈值的第二样本词,其中,所述第一阈值大于所述第二阈值;将所述多个候选词中与所述第二样本词匹配的候选词删除。在一些实施例中,所述意图识别结果包括:意图词、实体、实体类型;所述处理单元404可以用于:根据实体类型从多个预设的意图图谱中获取目标意图图谱,其中,目标意图图谱中至少包括:与实体关联的关联数据;基于所述意图词、所述实体、及所述关联数据,从指定的应答信息库中获取对应的应答信息。在一些实施例中,所述处理单元404可以用于:根据所述意图识别结果从指定的应答信息库中获取对应的应答信息;获取所述应答信息的内容;根据所述内容确定所述应答信息所属的任务类型;基于所述任务类型和所述应答信息执行相应操作。本申请实施例提供的基于自然语言识别的信息处理装置,通过结合上下文环境对用户输入的自然语言信息进行意图识别,提升了自然语言识别的准确性,使意图识别结果更加精准、有效;另外,通过自然语言的识别进行任务的分解分发,能够准确地对用户输入进行提取,进而在根据意图识别结果匹配应答信息时,提升应答信息的匹配成功率,从而可基于匹配到的应答信息准确执行相应操作实现运维处理,提升了运维时解决问题的效率。本申请实施例还提供一种终端。如图8所示,该终端可以包括射频RF,RadioFrequency电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真WiFi,WirelessFidelity模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图8中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:RF电路601可用于收发信息过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块SIM,SubscriberIdentityModule卡、收发信机、耦合器、低噪声放大器LNA,LowNoiseAmplifier、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序比如声音播放功能、图像播放功能等等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作,并根据预先设定的程式驱动相应的连接装置。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键比如音量控制按键、开关按键等、轨迹球、鼠标、操作杆等中的一种或多种。显示单元604可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器LCD,LiquidCrystalDisplay、有机发光二极管OLED,OrganicLight-EmittingDiode等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图8中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。终端还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和或或背光。音频电路606、扬声器,传声器可提供用户与终端之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如终端,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与终端的通信。WiFi属于短距离无线传输技术,终端通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块607,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。处理器608是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和或或模块,以及调用存储在存储器602内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。终端还包括给各个部件供电的电源609比如电池,优选的,电源可以通过电源管理系统与处理器608逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。具体在本实施例中,终端中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行意图识别,得到意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。本申请实施例提供的终端,通过结合上下文环境对用户输入的自然语言信息进行意图识别,提升了自然语言识别的准确性;另外,通过自然语言的识别进行任务的分解分发,能够准确地对用户输入进行提取并执行,提升了运维时解决问题的效率。本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种基于自然语言识别的信息处理方法中的步骤。例如,该指令可以执行如下步骤:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行意图识别,得到意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。以上各个操作的具体实施可参见前面的实施例,在此不再赘述。其中,该存储介质可以包括:只读存储器ROM,ReadOnlyMemory、随机存取记忆体RAM,RandomAccessMemory、磁盘或光盘等。由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种基于自然语言识别的信息处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种基于自然语言识别的信息处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。以上对本申请实施例所提供的基于自然语言识别的信息处理方法、相关设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

权利要求:1.一种基于自然语言识别的信息处理方法,其特征在于,包括:获取待识别的自然语言信息;根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;对修整后的自然语言信息进行意图识别,得到意图识别结果;基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。2.根据权利要求1所述的基于自然语言识别的信息处理方法,其特征在于,所述根据相关信息对待识别的自然语言信息进行修整,包括:确定所述相关信息的语义结构;基于所述语义结构对待识别的自然语言信息进行修整。3.根据权利要求2所述的基于自然语言识别的信息处理方法,其特征在于,所述语义结构包括关键词、及所述关键词之间的关联关系;所述基于所述语义结构对待识别的自然语言信息进行修整,包括:基于所述关键词对待识别的自然语言信息进行信息填充;基于所述关联关系对填充后的自然语言信息进行语序调整。4.根据权利要求2所述的基于自然语言识别的信息处理方法,其特征在于,确定所述相关信息的语义结构,包括:确定所述相关信息中各词语的词性和位置信息;基于所述词性和位置信息,生成所述相关信息中每个词语之间的关联关系。5.根据权利要求1-4任一项所述的基于自然语言识别的信息处理方法,其特征在于,所述对修整后的自然语言信息进行意图识别,得到意图识别结果,包括:对所述修整后的自然语言信息进行分词处理,得到多个候选词;基于预设知识库对多个候选词进行检索,得到检索结果;根据所述检索结果对所述多个候选词进行更新;基于更新后的候选词生成意图识别结果。6.根据权利要求5所述的基于自然语言识别的信息处理方法,其特征在于,所述检索结果包括:与每一候选词匹配的样本词、及候选词与样本词之间的匹配度;所述根据所述检索结果对所述多个候选词进行更新,包括:从所述样本词中确定对应匹配度低于第一阈值的第一样本词;将所述第一样本词替换所述多个候选词中与其匹配的候选词;从所述样本词中确定对应匹配度低于第二阈值的第二样本词,其中,所述第一阈值大于所述第二阈值;将所述多个候选词中与所述第二样本词匹配的候选词删除。7.根据权利要求5所述的基于自然语言识别的信息处理方法,其特征在于,所述基于更新后的候选词生成意图识别结果,包括:从更新后的候选词中识别实体;确定所述实体所属的实体类型;基于所述实体、所述实体类型及所述候选词,生成意图识别结果。8.根据权利要求7所述的基于自然语言识别的信息处理方法,其特征在于,所述意图识别结果包括:意图词、实体、实体类型;所述基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,包括:根据所述实体类型从多个预设的意图图谱中获取目标意图图谱,其中,所述目标意图图谱中至少包括:与所述实体关联的关联数据;基于所述意图词、所述实体、及所述关联数据,从指定的应答信息库中获取对应的应答信息。9.根据权利要求1所述的基于自然语言识别的信息处理方法,其特征在于,所述基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作,包括:根据所述意图识别结果从指定的应答信息库中获取对应的应答信息;获取所述应答信息的内容;根据所述内容确定所述应答信息所属的任务类型;基于所述任务类型和所述应答信息执行相应操作。10.一种基于自然语言识别的信息处理装置,其特征在于,包括:获取单元,用于获取待识别的自然语言信息;修整单元,用于根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和或下文信息;识别单元,用于识别对修整后的自然语言信息进行意图识别,得到意图识别结果;处理单元,用于基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。11.根据权利要求10所述的基于自然语言识别的信息处理装置,其特征在于,所述修整单元包括:确定子单元,用于确定所述相关信息的语义结构;修整子单元,用于基于所述语义结构对待识别的自然语言信息进行修整。12.根据权利要求11所述的基于自然语言识别的信息处理装置,其特征在于,所述语义结构包括关键词、及所述关键词之间的关联关系;所述修整子单元用于:基于所述关键词对待识别的自然语言信息进行信息填充;基于所述关联关系对填充后的自然语言信息进行语序调整。13.根据权利要求10-12任一项所述的基于自然语言识别的信息处理装置,其特征在于,所述识别单元包括:处理子单元,用于对所述修整后的自然语言信息进行分词处理,得到多个候选词;检索子单元,用于基于预设知识库对多个候选词进行检索,得到检索结果;更新子单元,用于根据所述检索结果对所述多个候选词进行更新;生成子单元,用于基于更新后的候选词生成意图识别结果。14.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-9任一项所述的基于自然语言识别的信息处理方法的步骤。15.一种终端,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-9任一项所述基于自然语言识别的信息处理方法中的步骤。

百度查询: 腾讯科技(深圳)有限公司 基于自然语言识别的信息处理方法、相关设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。