首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向任务式对话系统意图识别的语料库生成方法和装置_京东科技控股股份有限公司_201910163098.5 

申请/专利权人:京东科技控股股份有限公司

申请日:2019-03-05

公开(公告)日:2024-06-18

公开(公告)号:CN111666384B

主分类号:G06F16/332

分类号:G06F16/332

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2022.01.07#实质审查的生效;2021.12.17#著录事项变更;2020.09.15#公开

摘要:本申请提供了一种面向任务式对话系统意图识别的语料库生成方法和装置,该方法包括:基于预设规则生成第一语料库;删除第一语料库中重复的语料,记为第二语料库;通过预设的神经网络模型对第二语料库,以及获取的第三语料库进行语料的句嵌入,获得第二语料库对应的第一嵌入矩阵,以及第三语料库对应的第二嵌入矩阵;计算第一嵌入矩阵中的每个向量与第二嵌入矩阵中的每个向量的相关度;将所有相关度大于预设阈值的向量对应的第三语料库中的语料增加到第二语料库中,将当前第二语料库作为面向任务式对话系统意图识别的语料库。该方法能够快速生成多样性人机对话的语料库。

主权项:1.一种面向任务式对话系统意图识别的语料库生成方法,其特征在于,该方法包括:基于预设规则生成第一语料库;删除第一语料库中重复的语料,并记为第二语料库;通过预设的神经网络模型对第二语料库,以及获取的第三语料库进行语料的句嵌入,获得第二语料库对应的第一嵌入矩阵,以及第三语料库对应的第二嵌入矩阵;计算第一嵌入矩阵中的每个向量与第二嵌入矩阵中的每个向量的相关度;将所有相关度大于预设阈值的向量对应的第三语料库中的语料增加到第二语料库中,将当前第二语料库作为面向任务式对话系统意图识别的语料库;其中,第三语料库为人人对话的语料库,且与第一语料库为同一应用领域的语料库;其中,所述基于预设规则生成第一语料库,包括:获取语料模板以及对应的标签并存储;其中,所述语料模板为基于任务描述和专家归纳生成的,且所述语料模板符合预设规则;对存储的语料模板进行语法检查;若任一语料模板存在语法错误,则对该语料模板进行语法修改,直到该语料模板不存在语法错误;使用所有无语法错误的语料模板生成语料,以及每条语料的标签,作为第一语料库。

全文数据:

权利要求:

百度查询: 京东科技控股股份有限公司 面向任务式对话系统意图识别的语料库生成方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。