基于线索的离散推理方法及系统

导航：龙图腾网> 最新专利技术> 基于线索的离散推理方法及系统

申请/专利权人：重庆大学

申请日：2022-01-19

公开（公告）日：2024-06-25

公开（公告）号：CN114510941B

主分类号：G06F40/295

分类号：G06F40/295;G06F40/211;G06F18/2415;G06N3/048;G06N3/0442;G06N3/045;G06N3/09

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2022.06.03#实质审查的生效;2022.05.17#公开

摘要：本发明属于机器阅读理解技术领域，具体公开了一种基于线索的离散推理方法及系统，该系统包括编码模块、线索节点预测模块、推理模块和预测模块，编码模块用于提取文章和问题的词向量，线索节点预测模块用于预测已构建图中节点是否是线索节点，并在线索节点之间添加边，推理模块用于计算问题相关性得分和注意力权重系数，迭代更新节点特征向量，预测模块用于预测答案类型和答案。采用本技术方案，寻找文章中重要实体和数字，并在构建的关系网络图上挖掘推理信息，提高机器阅读理解中的离散推理能力。

主权项：1.一种基于线索的离散推理方法，其特征在于，包括如下步骤：获取文本，输入预训练模型，进行编码，提取文章和问题的词向量；利用命名实体识别工具确定问题和文章中包括的各实体和各数字节点，以及各数字分别对应的类型；根据词向量确定问题的特征向量，以及关系网络图中各节点的初始特征向量,问题对应词向量进行平均池化获得问题特征向量，节点对应词向量进行平均池化获得节点初始特征向量；将节点初始特征向量和问题特征向量输入线索节点预测器，预测节点是否为线索节点，以实体和数字为节点的异构关系图为基础，在线索节点之间添加边，获取新的异构关系图；基于节点特征向量，计算问题相关性得分，构建所有节点间的相关性矩阵，度量节点间的相关性；利用相关性矩阵，计算注意力权重系数，调整注意力分布；根据节点的邻居节点的注意力权重系数，对各邻接节点的特征向量进行加权求和，基于求和结果更新特征向量；预设迭代次数，根据预设数迭代后该节点的更新特征向量，更新问题和文章对应的词向量特征；将更新后的问题和文章对应的词向量输入分类模型中，得到预测答案类型和答案；预测线索节点的方法如下：利用图节点对应的词向量的池化特征作为节点的初始化特征向量，问题对应的词向量的池化特征作为问题的特征向量；利用远程监督方法训练一个线索节点预测器，在线索节点之间添加边，增加线索节点之间的邻接关系；将包含问题相关实体的句子中所有实体和数字对应节点作为线索节点；包含答案的句子中所有实体和数字对应节点作为线索节点；以及能计算得到答案的至多3个数字对应的节点作为线索节点；使用线索节点预测器预测线索节点，在线索节点之间添加边，同时将线索分布特征融入节点特征向量：Pi＝SoftmaxMLPq；hihi＝LNhi+pihi其中，q是问题特征向量，hi是节点特征向量，MLP是一个全连接网络，Pi是节点i是否为线索节点的概率分布，pi为该节点是线索节点的概率，LN是一个层标准化；利用图信息帮助词向量进行答案预测，将图信息和词向量信息进行融合：其中，Mi表示每个语义单元的词特征向量，Ji表示第i个语义单元对应图节点的索引，U用于预测模块预测答案类型和答案，是节点特征向量；预测模块包含五种不同答案的答案预测器和一个答案类型预测器：HQ,HP＝U其中，HQ和HP是融合后的问题和文章中每个词的特征向量联合；计算答案类型的概率分布：αp＝softmaxWpHPhp＝∑αpHPαq＝softmaxWqHQhq＝∑αqHQPtype＝softmaxFFN[hq；hp]αp，αq是文章和问题的每个词的权值分布，hQ,hP是问题和文章的词向量加权求和得到的综合特征向量，FFN表示前馈神经网络，Softmax表示一个激活函数；文章片段：从文章中抽取一个片段作为答案，计算答案在文章中的开始位置和结束位置的概率如下：其中，是文章中每个词的答案起始位置和答案终止位置的概率，m表示文章长度，f表示线性变换；问题片段：从问题中抽取一个片段作为答案，计算答案在问题中的开始位置和结束位置的概率如下：多片段：从问题和文章中抽取多个片段作为答案，用BIO标记法对问题和文章的每个词进行标记，其中，B表示某个片段的开始，I表示某个片段的中间，O表示不在片段中，最终答案是标记为BI的片段集合；计算问题和文章中每个词为BIO标记的概率分布如下：其中，表示第i个词的BIO标记的概率分布，hi表示问题和文章联合表示HQ,HP中第i个词的特征向量，f表示输出三分类的线性变换；计数：输出一个0至9的数字作为答案，该任务常常作为十分类任务进行处理，计算数字的概率分布如下：Pcount＝softmaxFFNhp；hq计算表达式：从文章中抽取的数字组成一个表达式，表达式计算结果作为答案，表达式中第i个数字的符号-1，0，+1的概率分布如下：其中，表示第i个数字在文章表示HP中的词向量；使用多任务联合训练一个线索预测器和阅读模型，对应线索预测任务，使用交叉熵损失进行训练： pk是第k个节点作为线索节点的概率，yk是第k个节点的标签；对于阅读模型，答案的概率由下述计算： Τ表示答案类型；采用边缘似然目标函数训练阅读模型，表示为Lans，最终的损失为：L＝Lans+λLevi。

全文数据：

权利要求：

百度查询：重庆大学基于线索的离散推理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动开盖的压力烹饪器具

下一篇：电芯和电子设备

相关技术

一种自动开盖的压力烹饪器具

电芯和电子设备

一种上颌窦膜推起工具

一种数控机床主轴箱冷却装置

一种安装工具

一种细分子印刷喷粉加工用研磨装置

一种地铁车辆车钩检修用辅助工具

一种叠加机

电池的装配结构、圆柱电池、电池模组和电池包

一种水利施工用混凝土搅拌装置

一种新型全遮光窗帘面料

一种防滑型无纺布的裁剪装置

推理相关技术

基于布尔代数的命题判断方法、演绎推理方法及系统_华院计算技术(上海)股份有限公司_202410191548.2

模型编码、模型推理方法、装置、电子设备和存储介质_上海壁仞科技股份有限公司_202410397719.7

卷积神经网络在量化过程前向推理降低精度损失的方法_北京君正集成电路股份有限公司_202010020803.9

具有模式切换机制的不完备信息推理方法_沈阳航空航天大学_202210363363.6

基于推理、规划、反思的LLM Agent问题解决方法及系统_浪潮智能终端有限公司_202410509579.8

一种用于全同态CNN推理的批量编码方法_浙江大学_202311606601.2

注意力机制计算和模型推理方法、装置、设备及介质_上海壁仞科技股份有限公司_202410473586.7

基于推理参数的映射函数到视频信号的自动应用_微软技术许可有限责任公司_202410388467.1

基于证据推理规则的双传感器目标检测融合方法和系统_合肥工业大学_202210590810.1

一种基于自注意力机制的循环特征推理的图像修复方法_长沙理工大学_202111230775.4

离散相关技术

一种基于Modelica语言的离散式动态集热器的建模方法_南京远思智能科技有限公司_202410508263.7

数据处理方法、连续风控数据的离散化方法及装置_支付宝(杭州)信息技术有限公司_202410346211.4

一种分析离散制造车间生产性能异常原因的方法_南京航空航天大学_202410420086.7

一种将电池的模拟能量流离散化成数字能量流的方法_云储新能源科技有限公司_202410354794.5

电动垂直起降载人飞行器的非离散安全性评估方法及系统_天目山实验室_202410274300.2

基于强化学习与事件触发的离散非线性系统混合容错协调跟踪控制方法_重庆大学_202410260470.5

基于健康函数及F-MOPA的航空发动机离散多点气路分析方法_西北工业大学_202410377125.X

一种数据驱动型线损异常线路时空区段离散化精准定位方法_国网河南省电力公司_202410437144.7

色散补偿离散相位滤波器_方内克斯数据系统公司_202280074177.9

基于线索的离散推理方法及系统_重庆大学_202210059201.3

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

坏点检测模型训练方法、坏点检测方法以及坏点修复方法_京东方科技集团股份有限公司_202280003858.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于线索的离散推理方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务