首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种确定语料意图的方法、装置及电子设备 

申请/专利权人:华为技术有限公司

申请日:2020-09-18

公开(公告)日:2024-06-25

公开(公告)号:CN112256863B

主分类号:G06F16/35

分类号:G06F16/35;G06F16/332;G06F40/194;G06F40/216

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2021.02.09#实质审查的生效;2021.01.22#公开

摘要:本申请提供了一种确定语料意图的方法、装置及电子设备,用以高效地确定语料意图,该方法包括:基于预设的规则对第一语料集进行核心词筛选之后,根据核心词对该语料集进行子集划分即分类,得到多个子集;对于多个子集中语料数量满足预设条件的子集,直接基于该子集对应的核心词,确定该子集的意图,对于多个子集中语料数量不满足预设条件的任一子集,将其作为新的第一语料集,采用新的核心词再对新的第一语料集进行子集划分,以此循环,直到所有的语料都能确定出意图。该方法的整个过程不需要人工参与,可以实现自动、高效、低成本地确定语料意图,进而提升对话机器人的智能性。

主权项:1.一种确定语料意图的方法,其特征在于,包括:确定第一语料集,所述第一语料集中包含若干条语料;对所述第一语料集执行下述预设操作:根据至少一个核心词对所述第一语料集中的语料进行子集划分,获得至少一个子集,其中,所述至少一个子集与所述至少一个核心词一一对应,每个所述子集中的语料均包含每个所述子集对应的核心词;在所述至少一个子集中的第一子集中的语料数量小于第一预设值时,基于所述第一子集对应的核心词,确定所述第一子集中的所有语料的第一意图,并基于所述第一意图为所述第一子集中的所有语料添加意图标签;所述第一子集为所述至少一个子集中的任意一个子集;在所述第一子集中的语料数量不小于所述第一预设值时,将所述第一子集重新作为所述第一语料集,并对重新确定的所述第一语料集执行所述预设操作;其中,对不同所述第一语料集执行所述预设操作时所使用的核心词的词性不同;其中,所述根据至少一个核心词对所述第一语料集中的语料进行子集划分,包括:在所述第一语料集中选择逆文本频率指数TF-IDF值大于设定阈值的动词或名词作为所述至少一个核心词;其中,在不同所述第一语料集中选择所述至少一个核心词时所基于的所述设定阈值大小相同或不同;基于所述至少一个核心词将所述第一语料划分为至少一个子集,所述至少一个子集中每个子集中的所有语料包含同一核心词;所述基于所述第一子集对应的核心词,确定所述第一子集中的所有语料的第一意图,包括:基于所述第一子集对应的核心词对所述第一子集的每条语料进行标注。

全文数据:

权利要求:

百度查询: 华为技术有限公司 一种确定语料意图的方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。