买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种输入方法及装置_北京搜狗科技发展有限公司_201810392678.7 

申请/专利权人:北京搜狗科技发展有限公司

申请日:2018-04-27

公开(公告)日:2024-04-26

公开(公告)号:CN110413133B

主分类号:G06F3/023

分类号:G06F3/023

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2020.11.06#实质审查的生效;2019.11.05#公开

摘要:本发明实施例提供一种输入方法和装置,所述方法包括:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。本发明实施例可以根据历史通讯记录建立第一语料库,并根据上屏输出内容和第一语料库对用户的输入内容进行预测,得到预测输入项,可免用户输入,直接从预测输入项中选择使用,有效提高用户输入效率,提升用户的输入体验,而且由于预测的输入项与上屏输出内容以及历史通讯记录相关,显示的预测输入项在一定程度上符合用户期望的输入内容,提供比较准确的候选项。

主权项:1.一种输入方法,其特征在于,包括:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取所述第二用户的输入信息对应的输入项,建立第一语料库,其中,所述第一语料库不包括所述第一用户的输入信息对应的输入项;所述第一语料库中的输入项是在接收到所述第二用户的输入内容后实时更新的;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项,所述第一用户的上屏输出内容为所述第一用户已经输出的内容;接收第一用户的编码字符串输入和或语音输入;基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项,以及,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项;其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库;利用所述第一候选项和所述第二候选项得到第三候选项,利用所述第一候选项的权重得分与所述第二候选项的权重得分对第三候选项进行排序,显示排序后的第三候选项;其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。

全文数据:一种输入方法及装置技术领域本发明实施例涉及计算机技术领域,具体涉及一种输入方法及装置。背景技术目前,输入应用可以根据用户输入的编码字符串,查询系统词库或者用户词库,获取并显示与所述编码字符串匹配的候选项。若系统词库或者用户词库不存在用户期望输入的候选词时,用户需要繁琐的操作才能输入期望的候选词。举例说明,若用户在使用即时通讯软件聊天时,对方询问:“线上有几台实机”,用户想要输入“3台实机”。但“实机”并非用户常用的输入词,当用户输入编码字符串“shiji”时,输入法应用显示的候选项为“时机”、“实际”、“十几”、“世纪”,并不能提供用户期望的候选项“实机”。用户往往需要单独输入“shi”、“ji”,分别上屏输出单字“实”、“机”,以完成输入。因此,现有技术提供的输入方法,存在候选项不准确、用户输入效率低的技术问题。发明内容本发明实施例提供了一种输入方法及装置,旨在解决现有技术候选项不准确、用户输入效率低的技术问题。为此,本发明实施例提供如下技术方案:第一方面,本发明实施例提供了一种输入方法,包括:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。优选的,所述方法还包括:响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。优选的,所述根据所述历史通讯记录获取各输入项,建立第一语料库包括:根据所述历史通讯记录,获取与第二用户的输入数据关联的通讯记录,建立第一语料库;所述与第一语料库包含从与第二用户关联的通讯记录中提取的各输入项;或者,根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项;其中,所述输入项包括输入词、表情输入或者图片输入。优选的,所述输入项具体为输入词,所述根据所述历史通讯记录获取各输入项包括:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。优选的,所述根据第一用户的上屏输出内容以及各输入项的特征属性,预测得到预测输入项包括:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。优选的,所述方法还包括:接收第一用户的编码字符串输入和或语音输入;基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项,以及,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项;其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库;利用第一候选项和第二候选项得到第三候选项,对第三候选项进行排序,显示排序后的第三候选项。第二方面,本发明实施例提供了一种输入装置,包括:通讯记录获取单元,用于获取第一用户与第二用户的历史通讯记录;语料库建立单元,用于根据所述历史通讯记录获取各输入项,建立第一语料库;预测单元,用于根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。第三方面,本发明实施例提供了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。第四方面,本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的输入方法。本发明实施例提供的输入方法及装置,可以根据第一用户和第二用户的历史通讯记录,获取输入项,并将获取的输入项建立第一语料库,然后根据第一用户的上屏输出内容以及第一语料库中各输入项的特征属性,预测第一用户即将要输入的输入项,并将预测输入项进行显示,以供第一用户直接从预测输入项选择需要输入的内容。可见,由于可以根据历史通讯记录建立第一语料库,并根据上屏输出内容和第一语料库对用户的即将输入的内容进行预测,得到预测输入项,从而使用户可以直接从预测输入项中选择使用,提高输入效率,提升用户的输入体验,而且由于预测的输入项与上屏输出内容以及历史通讯记录相关,显示的预测输入项在一定程度上符合用户期望的输入内容,提供比较准确的候选项。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种输入方法流程图;图2为本发明实施例提供的一种预测输入项效果示意图;图3为本发明实施例提供的另一种输入方法流程图;图4为本发明实施例提供的一种输入装置示意图;图5是根据一示例性实施例示出的一种用于输入装置的框图;图6是根据一示例性实施例示出的服务器的框图。具体实施方式本发明实施例提供了一种输入方法及装置,可以有效预测出第一用户即将要输入的内容,并将预测输入项进行显示,以供第一用户直接使用,提高输入效率,提升用户的输入体验,而且由于预测的输入项与上屏输出内容以及历史通讯记录相关,显示的预测输入项在一定程度上符合用户期望的输入内容,提供比较准确的候选项。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。下面将结合附图1对本发明示例性实施例示出的输入方法进行介绍。参见图1,为本发明实施例提供的一种输入方法流程图。本实施例提供的输入方法,可以包括:S101,获取第一用户与第二用户的历史通讯记录。本实施例中,第一用户为当前通讯终端的用户,第二用户为通讯终端对端的用户。在第一用户使用即时通讯软件聊天时,通讯终端会保存第二用户与第一用户的聊天内容,形成历史通讯记录。当第一用户与不同的用户聊天时,可以针对不同的用户保存对应的聊天内容,从而形成各自对应的历史通讯记录。在保存历史通讯记录时,可以将历史通讯记录与第二用户的标识建立对应关系,以便可以根据第二用户的标识获取对应的历史通讯记录。其中,通讯终端可以为智能手机、台式计算机、平板、笔记本等通讯设备。其中,历史通讯记录不仅包括用户聊天时所产生的通讯记录,还可以包括邮件往来等方式所产生的通讯记录。S102,根据所述历史通讯记录获取各输入项,建立第一语料库。可以理解的是,用户在聊天过程中,不仅可以发送文字信息,还可以发送图片,表情、语音等信息,因此,保存的历史通讯记录中可以包括文字、图片、表情、语音。其中,输入项可以包括输入词、表情输入或者图片输入。在实际应用中,针对历史通讯记录中的不同内容,获取各输入项时将采用不同的处理方法,下面将针对不同内容,提供具体的实施方式。在一些实施方式中,所述输入项具体为输入词,所述根据所述历史通讯记录获取各输入项包括:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。当历史通讯记录包括图片时,可以通过光学字符识别英文全称为OpticalCharacterRecognition,英文简称为OCR技术识别出该图片对应的文字,获取与文字识别结果对应的文本内容,根据该文本内容获取输入词,并将该输入词保存在第一语料库。比如,历史通讯记录中包括图片A,该图片A中包含文字“蓝瘦香菇”,则通过文字识别处理获得文本内容为“蓝瘦香菇”,根据该文本内容提取输入词“蓝瘦香菇”,并将该输入词保存到第一语料库中。又如,历史通讯记录包含图片B,该图片B包含文字“本宫来了”通过文字识别处理获得文本内容“本宫来了”,通过分词处理得到“本宫”、“来了”,可以将输入词“本宫”、“来了”均加入到第一语料库中,也可以仅将不常用的输入词“本宫”加入第一语料库。本实施例具体实现时,在通过文本识别技术获取与文字识别结果对应的文本内容后,可以对所述文本内容可以进行分词处理,然后将分词后的输入词加入到第一语料库中。同时,可以保存输入词与编码字符串的对应关系,所述编码字符串例如可以是拼音字符串、字形编码等。举例说明,可以对分词处理得到的输入词进行注音,获取该输入词的拼音,基于拼音为输入词建立索引,以便当第一用户输入拼音时,根据上述索引输出对应的输入词。例如,第一用户输入“bengong”,基于该拼音,在第一语料库中查找与该拼音对应的输入词“本宫”。当然,也可以针对分词后的输入词进行字形拆解,基于字形为输入词建立索引,以便第一用户利用五笔或手写方式进行输入。例如,第二用户输入“宄”,则将“宄”拆解成“宀”、“九”,以“宀”为索引,建立与“宄”的对应关系。当第一用户输入“宀”,则基于该索引,在第一语料库中查找与该索引对应的输入词“宄”。当历史通讯记录包括语音记录时,对语音内容进行语音识别处理,获取该语音对应的文本内容,并从该文本内容中获取输入词,同时将该输入词保存在第一语料库。其中,输入词可以是指完整的词语,并且是根据用户的对话场景获取的词语,比如,历史通讯记录中保存的信息为“那也就是实机了”,则获取的输入词为“实机”。当历史通讯记录包括纯文字信息时,可以直接从纯文字信息中获取输入词,并将该输入词保存在第一语料库。当历史通讯记录包括表情时,则可以获取该表情对应的文字标识,根据该文字标识获取输入词,并将该输入词保存在第一语料库。比如,有“微笑”表情、“流泪”表情、“委屈”表情等等,根据各表情对应的文字标识获取输入词。需要说明的是,根据第一语料库数据来源的不同,建立语料库可以有不同的方式。例如,仅使用第二用户的输入记录建立第一语料库,也可以使用第一用户和第二用户的输入记录建立共享语料库,其中,第二用户可以仅为一位用户,也可以为多位用户,比如,群聊时第一用户与多位用户进行通讯。下面将分别介绍第一语料库的建立。在一些实施方式中,根据所述历史通讯记录,获取与所述第二用户的输入数据关联的通讯记录,建立第一语料库,所述与第一语料库包含从与第二用户关联的通讯记录中提取的各输入项。其中,与第二用户的输入数据关联的通讯记录是指,在第一用户与第二用户聊天过程中,第二用户所输入的信息,也就是说,第一语料库中仅包括第二用户的输入信息对应的输入项,并不包括第一用户的输入信息对应的输入项。因此,第一语料库可以为第一用户准确提供回复第二用户的输入项,提高输入效率。当然,在实际应用中,也可以将第一语料库建立成共享语料库,即根据双方的历史通讯记录建立语料库,以供双方共同使用。具体实现时,可以将第一语料库保存在服务器中,第一用户和第二用户通过各自对应的终端设备访问服务器中的第一语料库,从而节省存储空间,创造良好的聊天环境。基于此,本实施例提供了一种实施方式,具体为:根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项。其中,历史通讯记录包括第一用户、第二用户在聊天过程中双方的输入信息,即第一语料库既包括第一用户的输入信息对应的输入项,也包括第二用户的输入信息对应的输入项。第一语料库为共享语料库,第一用户和第二用户均可以通过各自的终端设备调用共享语料库中的输入项。需要说明的是,第一语料库的内容可以定时或实时更新。例如,收到通讯对端的输入内容后即可以更新第一语料库的输入项以及各输入项的权重。其中,各输入项的权重计算方式为:权重Q=X1*输入词在当前通讯记录中的出现概率X2*输入词最新使用时间到现在的时间间隔,其中,X1、X2为系数,输入词在当前通讯记录中的出现概率是指某输入词出现的次数与通讯记录中总输入词的比值,比如,“本宫”在通讯记录中出现10次,通讯记录中总共包括100个输入词,则输入词“本宫”出现的概率为0.1。当然,也可以利用其它计算方式获得第一语料库中各输入项的权重。S103,根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。其中,预测输入项是基于第一用户的上屏输出内容以及第一语料库中各输入项的特征属性预测得到的,而普通输入项是基于用户输入的编码字符或语音输入匹配系统词库或用户词库得到的,因此,本实施例中预测输入项与普通输入项存在明显区别。在一些实施方式中,所述根据第一用户的上屏输出内容以及各输入项的特征属性,预测得到预测输入项包括:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。其中,第一用户的上屏输出内容为第一用户已经输出的内容;各输入项的输入频率是指输入项在聊天记录中的输入的次数;各输入项的使用时间是指输入项进入第一语料库的时刻起到当前时刻对应的时长。当然,也可以根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的权重,预测得到预测输入项,显示预测输入项。本实施例中,基于第一用户终端设备上屏输出内容以及第一语料库中各输入项的调用次数以及进库时长进行预测,得到预测输入项,并将预测输入项进行显示,以供第一用户直接选择。为便于理解,参见图2,该图为本实施例提供的预测效果示意图,左图为现有技术根据第一用户输入的编码字符串“shiji”匹配系统词库或用户词库提供输入项;右图为第一用户对应终端设备的上屏输出内容,该输出内容为“对,3台”,以及第一语料库中各输入项中特征属性,预测得到预测输入项,并将预测输入项进行显示,其中“实机”显示在第一位,表明该输入项的输入频率大,且进入第一语料库的时间不久,为新鲜输入项,被使用的概率大,通过该图可以看出,利用本实施例提供的方法,可免用户输入编码字符串“shiji”,便可为第一用户提供“实机”作为预测输入项,有效提高用户输入效率,为用户提供准确输入项。在一些实施方式中,响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。第一用户可以从显示的预测输入项中选择所需的输入项,根据用户的选择操作,将用户选择的输入项上屏输出,从而完成第一用户的输入操作。通过本发明实施例提供的方法,可以有效预测出第一用户即将要输入的内容,并将预测输入项进行显示,以供第一用户直接使用,提高输入效率,提升用户的输入体验,而且由于预测的输入项与上屏输出内容以及历史通讯记录相关,显示的预测输入项在一定程度上符合用户期望的输入内容,提供比较准确的输入项。上述实施例描述了基于第一用户和第二用户的历史通讯记录建立第一语料库,并根据第一语料库中各输入项的特征属性以及第一用户的上屏输出内容对第一用户即将输入的内容进行预测,并将预测输入项进行显示,以供第一用户直接使用,免去第一用户的输入操作。在实际应用中,还可以根据第一用户输入的编码字符串和或语音在第一语料库以及第二语料库中分别匹配对应的候选项,并对匹配得到的候选项进行处理后,为第一用户提供所期望的候选项,提升用户输入体验,基于此,下面将结合图3对上述方法进行介绍。参见图3,该图为本发明实施例提供的另一种输入方法流程图。本实施例中,输入方法可以包括:S301:接收第一用户的编码字符串输入和或语音输入。S302:基于编码字符串输入和或语音输入,在第一语料库中确定与编码字符串输入和或语音输入匹配的第一候选项。其中,第一语料库基于第一用户和第二用户的历史通讯记录得到,关于第一语料库的建立可以参见图1所述方法实现,在此不再赘述。S303:在第二语料库中确定与编码字符串和或语音输入匹配的第二候选项。其中,第二语料库为第一用户的系统语料库或个性语料库。S304:利用第一候选项和第二候选项得到第三候选项,对第三候选项进行排序,显示排序后的第三候选项。本实施例中,第一候选项可以包括多个候选的输入项,第二候选项也可以包括多个候选的输入项,考虑到第一候选项与第二候选项中可能会出现重复的输入项,可以删除其中任意一个重复的输入项,再将两个候选项合并后得到第三候选项。当然,也可以采用其他方法获得第三候选项,比如,提取第一候选项中前三个输入项以及第二候选项中的前三个输入项组成第三候选项,本实施例对第三候选项的获得方法不做限定。可以理解的是,第一候选项、第二候选项中的多个候选的输入项均是有序排列显示,为保证第三候选项中各个输入项按照顺序显示,以便为用户提供准确的输入项,在显示第三候选项之前,对第三候选项进行排序。在一些实施方式中,所述对第三候选项进行排序包括:利用第一候选项的权重得分与第二候选项的权重得分进行排序。本实施例中,根据第一候选项中各输入项的权重得分以及第二候选项中各输入项的权重得分计算第三候选项中各输入项的权重得分,根据计算的权重得分对第三候选项中的输入项进行排序。则第三候选项中各个输入项的权重可以利用Q=r1*Q1+r2*Q2,其中,r1和r2为预设系数,Q1为输入项在第一候选项中的权重得分,如果输入项未在第一候选项中,则Q1为预设的默认值;Q2为输入项在第二候选项中的权重得分,如果输入项未在第二候选项中,则Q2为预设的默认值。例如,第一候选项序列中包括三个输入项分别为A、B、C,各自的权重得分分别为q1、q2、q3;第二候选项序列中包括三个输入项分别为C、E、F,各自的权重得分分别为q4、q5、q6;则第三候选项为A、B、C、E和F,则QA=r1*q1+r2*b2,由于A未在第二候选项序列中,因此,b2为默认值;同理,QB=r1*q2+r2*b2;QC=r1*q3+r2*q4,由于输入项C在第一候选项序列和第二候选项序列中均存在,因此,b2为C在第二候选项序列中的权重得分q4计算;QE=r1*b1+r2*q5,由于A未在第一候选项中,因此,b1为默认值;同理,QF=r1*b1+r2*q6。然后,根据重新计算的权重得分,对第三候选项序列中各输入项进行排序,为第二用户显示排序的第三候选项。其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。第一候选项的输入频率是指第一候选项中输入项在第一语料库中输入的次数。第一候选项的使用时间与当前时间的差值即为第一候选项中输入项进入第一语料库的时间与当前之间的差值。为了便于理解,比如,第一候选项中输入项的输入频率为f,该输入项在第一语料库中的时长为t,则该输入项的权重得分Q1=a1*fa2*t,其中a1、a2为预设系数。此外,还可以通过输入词在通讯记录中的出现概率以及输入词出现时长计算权重。例如:权重得分Q1=X1*输入词在当前通讯记录中的出现概率X2*输入词最新使用时间到现在的时间间隔。第二候选项的权重得分的计算可以参见第一候选项的权重得分计算,或者采用其他计算方式。举例说明,若第二候选项来自系统词库,则可以根据输入法应用收集的用户输入数据统计各候选项的词频,根据词频计算得到权重得分。又如,若第二候选项来自用户词库,则可以根据当前用户的历史输入记录,统计各候选项的词频,根据词频计算得到权重得分。当然,权重得分的计算还可以采用其他方式,在此不进行限定。本实施提供的输入方法,基于第一用户输入的编码字符串和或语音,分别从第一语料库、第二语料库进行候选项的匹配,在获得第一候选项和第二候选项的基础上,获得第三候选项,并对第三候选项进行排序,为第一用户显示排序后的第三候选项,从而为第一用户显示准确的候选项,同时,由于第一语料库是根据历史通讯记录获得的,从而为第一用户提供所期望的候选项,提升用户输入体验,提高输入效率。下面对本发明实施例提供的方法对应的装置进行介绍,下述装置各模块的设置和实现可以参见图1和图3所示的方法对应实现。参见图4,该图为本发明实施例提供的一种输入装置示意图。一种输入装置400,该装置包括:通讯录获取单元401、语料库建立单元402、预测单元403;通讯记录获取单元401,用于获取第一用户与第二用户的历史通讯记录。语料库建立单元402,用于根据所述历史通讯记录获取各输入项,建立第一语料库。预测单元403,用于根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。在一些实施方式中,该装置还包括:输出单元,用于响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。在一些实施方式中,语料库建立单元具体用于:根据所述历史通讯记录,获取与第二用户的输入数据关联的通讯记录,建立第一语料库;所述第一语料库包含从与第二用户关联的通讯记录中提取的各输入项;或者,根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项;其中,所述输入项包括输入词、表情输入或者图片输入。在一些实施方式中,语料库建立单元具体用于:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。在一些实施方式中,预测单元具体用于:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。在一些实施方式中,该装置还包括:接收子单元,用于接收第一用户的编码字符串输入和或语音输入。第一确定子单元,用于基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项。第二确定子单元,用于基于所述编码字符串输入和或语音输入,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项。其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库。第三确定子单元,用于利用第一候选项和第二候选项得到第三候选项,对第三候选项进行排序,显示排序后的第三候选项。在一些实施方式中,所述第三确定子单元具体用于:利用第一候选项的权重得分与第二候选项的权重得分进行排序;其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。需要说明的是,本实施例装置各模块的设置可以参见图1和图3所示的方法对应实现,在此不再赘述。参见图5,为本发实施例提供的一种用于输入装置的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入输出IO的接口512,传感器组件514,以及通信组件516。处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理部件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器SRAM,电可擦除可编程只读存储器EEPROM,可擦除可编程只读存储器EPROM,可编程只读存储器PROM,只读存储器ROM,磁存储器,快闪存储器,磁盘或光盘。电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器LCD和触摸面板TP。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。音频组件510被配置为输出和或输入音频信号。例如,音频组件510包括一个麦克风MIC,当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。IO接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件515还可以检测装置500或装置500任意一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速减速和装置500的温度变化。传感器组件515可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括近场通信NFC模块,以促进短程通信。例如,在NFC模块可基于射频识别RFID技术,红外数据协会IrDA技术,超宽带UWB技术,蓝牙BT技术和其他技术来实现。在示例性实施例中,装置500可以被一个或多个应用专用集成电路ASIC、数字信号处理器DSP、数字信号处理设备DSPD、可编程逻辑器件PLD、现场可编程门阵列FPGA、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。具体地,本发明实施例提供了一种XX装置500,包括有存储器505,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器505中,且经配置以由一个或者一个以上处理器520执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:所述根据所述历史通讯记录获取各输入项,建立第一语料库包括:根据所述历史通讯记录,获取与第二用户的输入数据关联的通讯记录,建立第一语料库;所述第一语料库包含从与第二用户关联的通讯记录中提取的各输入项;或者,根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项;其中,所述输入项包括输入词、表情输入或者图片输入。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:所述输入项具体为输入词,所述根据所述历史通讯记录获取各输入项包括:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:所述根据第一用户的上屏输出内容以及各输入项的特征属性,预测得到预测输入项包括:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收第一用户的编码字符串输入和或语音输入;基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项,以及,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项;其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库;利用第一候选项和第二候选项得到第三候选项,对第三候选项进行排序,显示排序后的第三候选项。进一步地,所述处理器520具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:所述对第三候选项进行排序包括:利用第一候选项的权重得分与第二候选项的权重得分进行排序;其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器505,上述指令可由装置500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器RAM、CD-ROM、磁带、软盘和光数据存储设备等。一种机器可读介质,例如该机器可读介质可以为非临时性计算机可读存储介质,当所述介质中的指令由装置终端或者服务器的处理器执行时,使得装置能够执行一种输入方法,所述方法包括:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。可选地,所述方法还包括:响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。可选地,所述根据所述历史通讯记录获取各输入项,建立第一语料库包括:根据所述历史通讯记录,获取与第二用户的输入数据关联的通讯记录,建立第一语料库;所述第一语料库包含从与第二用户关联的通讯记录中提取的各输入项;或者,根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项;其中,所述输入项包括输入词、表情输入或者图片输入。可选地,所述输入项具体为输入词,所述根据所述历史通讯记录获取各输入项包括:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。可选地,所述根据第一用户的上屏输出内容以及各输入项的特征属性,预测得到预测输入项包括:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。可选地,所述方法还包括:接收第一用户的编码字符串输入和或语音输入;基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项,以及,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项;其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库;利用第一候选项和第二候选项得到第三候选项,对第三候选项进行排序,显示排序后的第三候选项。可选地,所述对第三候选项进行排序包括:利用第一候选项的权重得分与第二候选项的权重得分进行排序;其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。图6是本发明实施例中服务器的结构示意图。该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器centralprocessingunits,CPU622例如,一个或一个以上处理器和存储器632,一个或一个以上存储应用程序662或数据666的存储介质630例如一个或一个以上海量存储设备。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块图示没标出,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口660,一个或一个以上输入输出接口668,一个或一个以上键盘666,和或,一个或一个以上操作系统661,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

权利要求:1.一种输入方法,其特征在于,包括:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于第一用户针对所述预测输入项的触发操作,上屏输出与所述触发操作对应的预测输入项。3.根据权利要求1所述的方法,其特征在于,所述根据所述历史通讯记录获取各输入项,建立第一语料库包括:根据所述历史通讯记录,获取与第二用户的输入数据关联的通讯记录,建立第一语料库;所述第一语料库包含从与第二用户关联的通讯记录中提取的各输入项;或者,根据所述历史通讯记录,建立与所述第一用户、所述第二用户关联的共享语料库;所述共享语料库包含从所述历史通讯记录提取的各输入项;其中,所述输入项包括输入词、表情输入或者图片输入。4.根据权利要求1或3所述的方法,其特征在于,所述输入项具体为输入词,所述根据所述历史通讯记录获取各输入项包括:若所述历史通讯记录包含图片时,对所述图片进行文字识别处理,获取与文字识别结果对应的文本内容,利用所述文本内容获取各输入词;若所述历史通讯记录为语音记录时,对所述语音记录进行语音识别处理,获取与语音识别结果对应的文本内容,利用所述文本内容获取各输入词。5.根据权利要求1所述的方法,其特征在于,所述根据第一用户的上屏输出内容以及各输入项的特征属性,预测得到预测输入项包括:根据第一用户的上屏输出内容、各输入项的输入频率、各输入项的使用时间,预测得到预测输入项。6.根据权利要求1或3所述的方法,其特征在于,所述方法还包括:接收第一用户的编码字符串输入和或语音输入;基于所述编码字符串输入和或语音输入,在第一语料库中确定与所述编码字符串输入和或语音输入匹配的第一候选项,以及,在第二语料库中确定与所述编码字符串输入和或语音输入匹配的第二候选项;其中,所述第一语料库基于所述第一用户与第二用户的历史通讯记录得到;所述第二语料库为所述第一用户的系统语料库或者个性语料库;利用所述第一候选项和所述第二候选项得到第三候选项,对所述第三候选项进行排序,显示排序后的第三候选项。7.根据权利要求6所述的方法,其特征在于,所述对第三候选项进行排序包括:利用第一候选项的权重得分与第二候选项的权重得分进行排序;其中,所述第一候选项的权重得分与所述第一候选项的输入频率成正比、与所述第一候选项的使用时间与当前时间的差值成反比。8.一种输入装置,其特征在于,包括:通讯记录获取单元,用于获取第一用户与第二用户的历史通讯记录;语料库建立单元,用于根据所述历史通讯记录获取各输入项,建立第一语料库;预测单元,用于根据所述第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。9.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取第一用户与第二用户的历史通讯记录;根据所述历史通讯记录获取各输入项,建立第一语料库;根据所述第第一用户的上屏输出内容以及所述第一语料库中各输入项的特征属性,预测得到预测输入项,显示所述预测输入项。10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的输入方法。

百度查询: 北京搜狗科技发展有限公司 一种输入方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。