一种基于大语言模型的实体关系抽取方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：安徽思高智能科技有限公司

摘要：本发明公开了一种基于大语言模型的实体关系抽取方法，旨在提升关系抽取任务的泛化性能。该方法首先准备包含训练数据集和测试数据集的数据，并利用预训练词嵌入模型对文本编码。然后使用大语言模型对预定义的实体关系标签生成定义描述,帮助模型理解各类关系涵义。对于测试数据集中的每个样本，通过计算与训练样本的相似度，检索得到k个最相似的支持集样本。并对支持集样本利用大语言模型生成关系成立的推理解释。同时，从知识库中检索测试样本中主客体实体的背景知识。最后，将关系定义、支持集样本及推理解释、背景知识等信息构建为提示，输入大语言模型进行关系推理,得到预测结果。

主权项：1.一种基于大语言模型的实体关系抽取方法，其特征在于：包括：S1：获取待用数据，包含训练数据集Dtrain和测试数据集Dtest；S2：对预定义的实体关系标签进行定义解释；步骤S2的实现过程为：S2.1：对每个测试样本的真实关系标签ri，构造提示"请解释关系ri的定义和判断条件"，输入大语言模型生成响应di；S2.2：将di与真实关系标签ri组成元组ri,di，得到关系定义集合Drel；S3：对测试数据集Dtest中的每个测试样本contenti,esi,ri,eoi，通过在训练数据集Dtrain中检索相似的k个示例，并利用大语言模型生成推理解释；其中，ri表示测试样本的真实关系标签，esi表示测试样本的主实体，eoi表示测试样本的客实体，contenti表示测试样本的原始文本，i=1,2,3,...,m，m为正整数；步骤S3中的实现过程为：S3.1：对训练数据集和测试数据集中的样本进行预处理和词嵌入处理，样本包括训练样本和测试样本；S3.2：对每个测试样本contenti,esi,ri,eoi，计算其与所有训练样本contentj,esj,rj,eoj的三元组相似度sim_tricontenti,esi,ri,eoi,contentj,esj,rj,eoj，选取相似度最高的k个样本作为支持集Si；三元组相似度的计算公式为：sim_tricontenti,esi,ri,eoi,contentj,esj,rj,eoj=cosvsi',vsj'+cosvoi',voj'其中，vsi'为测试样本contenti,esi,ri,eoi的主实体和上下文的拼接嵌入，voi'为测试样本contenti,esi,ri,eoi的客实体和上下文的拼接嵌入，vsj'为训练样本contentj,esj,rj,eoj的主实体和上下文拼接嵌入，voj'为训练样本contentj,esj,rj,eoj的客实体和上下文的拼接嵌入，cos·为余弦相似度函数；S3.3：对Si中每个样本contentik,sik,rik,oik，构造提示并输入至大语言模型，生成关系sik,rik,oik成立的推理解释Ei，其中，contentik表示支持集中样本的原始文本，sik表示支持集中样本的主客体，rik表示支持集中样本的真实关系标签，oik表示支持集中样本的客实体；S3.4：将Si与对应的推理解释Ei组成测试样本的注释数据Di；S4：从知识库KB中检索测试样本中主实体esi和客实体eoi的背景知识，并拼接成上下文信息ci；S5：将关系定义集合Drel、支持集Si及推理解释Ei、上下文信息ci拼接成提示pi，输入至大语言模型；S6：大语言模型根据提示pi，对测试样本contenti,esi,ri,eoi进行关系推理，输出预测的关系标签yi'；S7：将预测的关系标签yi'与真实关系标签ri进行比较，评估大语言模型的性能，当达到预设精度后，得到最终的大语言模型，利用最终的大语言模型可以实现对任一实体关系的抽取。

全文数据：

权利要求：

百度查询：安徽思高智能科技有限公司一种基于大语言模型的实体关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用户装备、基站和用于激活和释放多个配置的授权的方法

下一篇：一种胶囊药粒干燥装置及其干燥方法

相关技术

用户装备、基站和用于激活和释放多个配置的授权的方法

一种胶囊药粒干燥装置及其干燥方法

一种用于球墨铸铁井盖生产的打磨装置

一种会话检测方法、装置、检测设备及计算机存储介质

一种豆制品分离设备

一种导电布精准裁切装置

一种曲柄摇杆式道闸机芯

涡轮机部件或部件的组合件

信号处理方法、装置及基站

识别操作终端设备的手势的方法和终端设备

一种智能制造一体化用生产管理系统

一种用例生成方法、装置、服务器及存储介质

关系相关技术

一种钻井井场智能网关系统_中国石油化工集团有限公司_202310463177.4

定时关系增强方法、基站和通信系统_中国电信股份有限公司_202110200797.X

一种基于时空关系增强的跨模态文本-视频检索方法_湖南大学_202111312233.1

一种基于连续关系的喷头控制方法及系统_深圳市智能派科技有限公司_202411139992.6

一种基于FP-Growth关联分析算法的目标态势关系挖掘方法_中国人民解放军国防科技大学_202410933038.8

针对于实体及实体关系的联合抽取方法、装置及存储介质_首都经济贸易大学_202410919579.5

客户关系管理系统数据同步方法、系统、设备及存储介质_携程商旅信息服务(上海)有限公司_202210093111.6

一种群体和谓词并行预测的群体视觉关系检测方法_南京大学_202310496397.7

手持式电穿孔装置以及相关系统和方法_艾诺奥医药品有限公司_202380029214.9

多智能体系统在合作竞争关系下的反同步优化控制方法_安庆师范大学_202210751251.8

模型相关技术

一种跨模态视触觉数据仿真生成模型及模型训练装置_华南师范大学_202410944861.9

用于节点故障管理的管理模型_瑞典爱立信有限公司_202080027348.3

一种人体模型_宁波弥鹿创意科技有限公司_202420552092.3

老年乳腺癌预测模型_中国医学科学院北京协和医院_202410920896.9

使用扩散模型进行视频编辑_谷歌有限责任公司_202480001938.7

用于预测模型的数据泛化_国际商业机器公司_202010783314.9

用于训练机器学习模型的方法_罗伯特·博世有限公司_202410537639.7

用于CAD模型检索的机器学习_达索系统公司_202410500489.2

一种基于目标检测的下边缘检测模型的训练方法、模型和存储介质_纵目科技(上海)股份有限公司_201910158356.0

基于hNPY与hAgRP的基因过表达嵌合动物模型、工程猴模型及应用_四川横竖生物科技股份有限公司_202110886127.8

抽取相关技术

基于特征抽取的木材表面缺陷识别办法_南通致远新能源科技有限公司_202411389141.7

针对于实体及实体关系的联合抽取方法、装置及存储介质_首都经济贸易大学_202410919579.5

基于迁移学习的跨领域多模态工业数据抽取与融合方法_广东恒电信息科技股份有限公司_202411235791.6

一种虚拟奖品的抽取方法、系统、电子设备及存储介质_广州易娱网络科技有限公司_202410929474.8

用于改进频带边缘陡峭度的具有抽取极点的梯式滤波器_株式会社村田制作所_202410536612.6

一种机器人报修场景的手机号抽取方法_华云天下(南京)科技有限公司_202410903915.7

一种餐厨垃圾清运车的抽取机构_广汉市胜鹰机械有限责任公司_202420500518.0

一种基于大语言模型的实体关系抽取方法_安徽思高智能科技有限公司_202411139659.5

根据筛选规则抽取压缩包子文件的方法、系统及介质_中孚安全技术有限公司_202411399241.8

一种针对非结构化车型数据的知识联合抽取方法、系统、存储介质和设备_中汽智联技术有限公司_202410883512.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大语言模型的实体关系抽取方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务