首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种整合多源常识知识的多轮共情对话生成方法_华中师范大学_202410349774.9 

申请/专利权人:华中师范大学

申请日:2024-03-26

公开(公告)日:2024-06-18

公开(公告)号:CN118211662A

主分类号:G06N5/04

分类号:G06N5/04;G06N5/025;G06N3/042;G06N3/0455;G06N3/096;G06F16/332;G06F16/335;G06F16/35

优先权:

专利状态码:在审-公开

法律状态:2024.06.18#公开

摘要:本发明提供一种整合多源常识知识的多轮共情对话生成方法,包括以下步骤:S1、将历史多轮对话内容作为对话上下文,分别输入到COMET、LLama2和ConceptNet知识库中,从而获取三类常识知识:短语型推理知识、文档型事实知识以及三元组型本体知识;S2、分别使用词嵌入技术、Transformer编码器和图神经网络GNN对获得推理知识、事实知识和本体知识进行编码处理,生成对应的推理知识特征向量、事实知识特征向量和本体图特征向量;S3、将编码后的知识特征向量和对话上下文一同输入到预训练模型,通过该模型的处理和生成,产生共情回复;本发明通过整合多源常识知识,有效解决了单一来源知识在覆盖率和领域知识限制方面的不足。这种方法显著增强了模型在语义理解和情感感知方面的能力,从而使得生成的共情回复更加精准、丰富和多样化,提升了对话系统的整体性能和用户体验。

主权项:1.一种整合多源常识知识的多轮共情对话生成方法,其特征在于,包括如下步骤:S1、将历史多轮对话内容作为对话上下文,分别输入到COMET、LLama2以及ConceptNet,从而获得三类常识知识:短语型推理知识、文档型事实知识以及三元组型本体知识;S2、针对不同形式的常识知识,采用三种编码方式将三种不同的常识知识转化为对应的特征向量,以便后续注入预训练模型:对于短语型推理知识,采用词嵌入技术将单词或短语的语义信息转化为具有固定维度的向量;对于文档型事实知识,使用Transformer编码器进行特征提取,以捕捉句子内部的上下文信息;对于三元组本体知识,将三元组转化为图形结构,并利用图神经网络来捕捉三元组中的实体关系信息;S3、将推理知识特征向量、事实知识特征向量及本体图特征向量输入到基于Transformer架构的预训练模型BART的前馈网络模型中,这些特征向量作为附加输入,与BART编码器的隐藏表征一同经过前馈网络处理,通过该模型的处理和生成,产生共情回复。

全文数据:

权利要求:

百度查询: 华中师范大学 一种整合多源常识知识的多轮共情对话生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。