首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于预训练语言模型的本体修正方法与系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明公开了一种基于预训练语言模型的本体修正方法与系统,属于语义网中本体修正技术领域。首先将待修正本体与可靠本体中的公理翻译成自然语言句子,基于预训练模型计算句子的向量,根据向量和打分函数为待修正本体R‑MIPS中的公理进行打分,通过分批处理不可满足概念计算出一个修正方案。本发明根据本体修正的特征定义了四个基于预训练语言模型的打分函数,提出了一个基于预训练语言模型分批处理不可满足概念的本体修正方法,用户可以对本体修正方法中的参数进行个性化配置,有助于满足用户多样化的需求。

主权项:1.一种基于预训练语言模型的本体修正方法,其特征在于,包括:将输入的可靠本体K0与待修正本体K中的公理转成自然语言的句子,然后再用预训练模型将句子转成稠密的向量;获取给定数量的不可满足概念,计算其R-MIPS;给R-MIPS中每条公理进行打分,然后根据不同的打分函数采用对应的子集抽取策略从每个R-MIPS中抽取子集;基于R-MIPS中抽取的子集,计算得到最优修正方案,使得从K中移除该方案的所有公理后K∪K0变成协调的;去除所述最优修正方案中的冗余公理,得到去过冗余的最终解决方案;所述获取给定数量的不可满足概念,计算其R-MIPS,包括:调用标准的本体推理机Pellet对K'∪K0进行推理,获得给定数量不可满足概念;如果确实获得到k个不可满足概念,则计算这些不可满足概念的本地R-MIPS;否则,获得当前剩余的不足k个的不可满足概念,再计算其本地R-MIPS,其中,k为步长;所述本地R-MIPS的定义是:假设有一个可靠的本体K0和一个待修改本体K,则K相对于K0的一个R-MIPSK'是K的子集,并且满足以下条件:1K'∪K0是不协调的;2对于每个K”∪K0是协调的,一个本体是不协调的当且仅当该本体包含至少一个不可满足概念,一个概念是不可满足的当且仅当它的解释为空集;所述计算这些不可满足概念的本地R-MIPS时,先计算这些不可满足概念的所有R-MUPS,然后从中挑选出R-MIPS;所述R-MUPS的定义为:假设有一个可靠的本体K0和一个待修改本体K,对于K有关K0的一个不可满足概念C,它的一个R-MUPSK'是K的一个子集,且满足以下条件:1C在K'∪K0中不可满足;2对于每个C在K”∪K0是可满足的;所述计算这些不可满足概念的所有R-MUPS是指计算每个不可满足概念的所有R-MUPS的并集,而一个不可满足概念所有R-MUPS的计算采用基于碰集树的黑盒方法;单个R-MUPS的计算先不停地从K中挑选公理添加到初始化为空集的集合S中,直到当前的S与K0的并集使得C变成不可满足时停止添加;然后再逐个检查S中的公理,如果从S中移除一个公理后C仍然在S∪K0中是不可满足的,那么就从S中移除该公理;最后得到的S就是一个R-MUPS;基于碰集树的黑盒方法是指将一个R-MUPS作为一棵树的根节点,该R-MUPS中每条公理作为边,对每条边进行遍历,如果从K中删除该边上的公理后,C仍然在K∪K0中不可满足,则继续在当前的K中找下一个相对于K0的有关C的R-MUPS,再将该R-MUPS作为此边连接的节点,再继续将当前R-MUPS的所有公理作为边,从根节点出发的一条路径结束的标志是从原始的K中移除该路径上所有边表示的公理,使得C在K∪K0中变得可满足,通过该碰集树的构建,节点上的所有R-MUPS是C在K中相对于K0的所有R-MUPS;所述给R-MIPS中每条公理进行打分,然后根据不同的打分函数采用对应的子集抽取策略从每个R-MIPS中抽取子集,包括:设计四种不同的打分函数,所述四种打分函数中包括基于R-MIPS并集的打分函数、基于R-MIPS的打分函数、基于待修正本体的打分函数与基于可靠本体的打分函数,这些函数的定义都基于一个公理集合与一条公理之间的相似度的计算,其中,如果选择基于可靠本体的打分函数,那么从每个R-MIPS中抽取分数最低的那些公理构成子集;如果选择另外三种打分函数,那么抽取分数最高的公理为子集;假设有一个可靠的本体K0和一个待修正本体K,给定K中一条公理a、K∪K0的一个子集S和一个预定义的阈值t,a与S之间的相似度定义为: 其中,S'={b∈S|simva,vb≥t},va与vb分别表示公理a与b对应的向量,simva,vb表示va与vb之间的相似度;假设表示K有关K0的一个R-MIPS集合,则基于R-MIPS并集的打分函数定义为a与R-MIPS并集中公理的平均相似度,具体定义如下: 基于R-MIPS的打分函数的定义为a与R-MIPS的平均相似度,具体定义如下: 基于待修正本体的打分函数的定义为a与K中公理的平均相似度,具体定义如下: 基于可靠本体的打分函数的定义为a与K0中公理的平均相似度,具体定义如下:

全文数据:

权利要求:

百度查询: 南京邮电大学 一种基于预训练语言模型的本体修正方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。