首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】融合事实文本的问句分解式语义解析方法_昆明理工大学_202210288047.7 

申请/专利权人:昆明理工大学

申请日:2022-03-23

公开(公告)日:2024-06-18

公开(公告)号:CN114841170B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/295;G06F16/2452

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2022.08.19#实质审查的生效;2022.08.02#公开

摘要:本发明涉及融合事实文本的问句分解式语义解析方法,属于自然语言处理技术领域。本发明包括步骤:分为分解‑抽取‑解析三个阶段,首先把复杂问题分解成简单子问题序列,然后抽取原始问题和子问题中的关键信息,最后通过整合以上信息生成结构化查询语句。同时,为了避免在分解过程中实体判断错误或主题实体缺失的情况,又将知识库中的三元组转化成用自然语言描述的事实文本信息,构造事实文本库,采用注意力机制获取更丰富的知识,旨在增强实体的表示信息,减少错误传播。本发明融合了事实文本信息,采用问句分解的方式对复杂问题进行语义解析,提升了问答模型对复杂问题的理解能力,从而解决了知识库问答技术对复杂问题的处理效果不佳的问题。

主权项:1.融合事实文本的问句分解式语义解析方法,其特征在于:首先,将知识库中的三元组转化成用自然语言描述的事实文本信息,构建了一个事实文本库,采用注意力机制获取更丰富的知识表示作为辅助信息;其次,将复杂问题的语义解析过程分为三个阶段,在第一个问句分解阶段,将复杂问题分解成一系列简单的子问题序列;在第二个信息抽取阶段,对原问题和子问题序列进行信息抽取和整合,获取关键信息;在第三个语义解析阶段,生成相应的结构化查询语句;具体步骤如下:Step1、构建了一个事实文本库作为知识来源;在知识库中,信息以三元组的形式存在,包括头实体、关系和尾实体,通过头实体,关系,尾实体这样的结构构建了一张图网络;将三元组通过人工设计模版转化成用自然语言描述的句子;Step2、基于Transformer的编码器-解码器框架,在Transformer的基础上利用文本库感知注意力机制融入事实文本信息;Step3、在编码端和解码端都利用了文本库感知注意力机制动态地关注输入序列中的局部信息,让模型在面对当前输入序列时更专注于与事实文本相关联的实体信息或关系信息;所述Step1的具体步骤为:Step1.1、在数据预处理时,首先用斯坦福的命名实体识别工具识别出问句中的实体,得到一个实体集合,以实体集合中的实体作为头实体或尾实体抽取知识库中的三元组;Step1.2、然后根据人工设计模板将三元组表示为事实文本;Step1.3、最后利用BERT将问句和事实文本编码成向量,计算问句和事实文本之间的余弦相似度,选取top-n的事实文本句子构建事实文本库。

全文数据:

权利要求:

百度查询: 昆明理工大学 融合事实文本的问句分解式语义解析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。