首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

智能化文本对话生成方法、装置及计算机可读存储介质 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-01-09

公开(公告)日:2024-06-25

公开(公告)号:CN111221942B

主分类号:G06F16/33

分类号:G06F16/33;G06F16/332;G06F40/289;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2022.02.01#实质审查的生效;2020.06.02#公开

摘要:本发明涉及一种人工智能技术,揭露了一种智能化文本对话生成方法,包括:获取原始对话文本集,对所述原始对话文本集进行分词处理后得到更新对话文本集,对所述更新对话文本集构造无向图,根据所述无向图构计算得到关键字集,对所述关键字集利用独热编码算法处理得到词向量集,将所述词向量集输入至预先训练完成的文本语义理解模型,经过卷积操作和记忆更新得到文本预测集,接收用户输入的当前问题,基于相似度计算方法计算所述当前问题与所述文本预测集中相似度最高的文本并输出所述文本,完成与所述当前问题的智能化文本对话。本发明还提出一种智能化文本对话生成装置以及一种计算机可读存储介质。本发明可以实现精准高效的文本对话生成功能。

主权项:1.一种智能化文本对话生成方法,其特征在于,所述方法包括:获取原始对话文本集,并对所述原始对话文本集进行清洗和分词处理后得到更新对话文本集;对所述更新对话文本集内每个词语构造无向图,根据所述无向图构建依存关系图,根据所述依存关系图计算得到所述更新对话文本集中的关键字集,并对所述关键字集利用独热编码算法处理得到词向量集;将所述词向量集输入至预先训练完成的文本语义理解模型,对所述词向量集经过激活处理、卷积操作和记忆更新得到文本预测集;接收用户输入的当前问题,基于相似度计算方法从所述文本预测集中计算与所述当前问题相似度最高的文本并输出所述文本,完成与所述当前问题的智能化文本对话;所述独热编码算法是词向量表示的一种方法,包括:通过提取语料库中所有的词构建一个词典,其中的每个词都用一个词向量表示,该向量的维度和词典规模相等,并且向量中只有当前词对应的维度的值是1,其余维度的值全部为0;基于已提取出的所述语料库遍历所述关键字集得到词向量集;所述对所述词向量集经过激活处理、卷积操作和记忆更新得到文本预测集,包括:调取与所述词向量集对应的激活函数对所述词向量集进行激活处理,将所述激活处理后的词向量集进行卷积操作得到卷积数据集,并将所述卷积数据集伸展为一维数据集,将所述一维数据集进行记忆更新得到候选数据集,根据调取的所述激活函数计算所述候选数据集得到文本预测集;所述激活函数为: 其中:pwli为第i个样本中,所述文本语义理解模型选对文本的概率;puli为第i个样本中,所述文本语义理解模型中选对所述文本的答案的概率;为第i个样本中,所述文本语义理解模型中基于所述pwli下,选错答案的条件概率;pwli为第i个样本中,所述文本语义理解模型中基于所述puli下选对答案的条件概率,为第i个样本中,所述文本语义理解模型中基于所述下进一步选错答案的条件概率;所述卷积操作的操作方法是预先构建卷积模板和卷积幅度提取词向量特征,预先构建卷积模板为将所述词向量与预先构建卷积模板进行对应维度相乘,得到的所述卷积数据集;所述一维数据集是基于全连接窗口进行一维化得到的。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 智能化文本对话生成方法、装置及计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。