买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国标准化研究院
摘要:本发明公开了一种标准信息要素一致性检验方法,该方法根据标准库中的各标准信息的三元组集合,基于所述实体库和所述待验证信息进行比较,确定与所述待验证信息关联度最高的标准信息;将所述待验证信息每个句子中的主实体和客实体与关联度最高的标准信息的实体对进行对应,基于关系抽取模型得到待验证信息的三元组集合;将待验证信息的三元组集合和标准信息的三元组集合进行比较,得到所述待验证信息与标准信息的一致性检验结果;该方法提高了要素一致性的效率,在减少计算量的同时能够确保结果的准确性和可靠性。
主权项:1.一种标准信息要素一致性检验方法,用于检验待验证信息与标准信息中要素的一致性,其特征在于,所述方法包括以下步骤:步骤1,根据标准库中的各标准信息的三元组集合,得到各标准信息的实体对集合构成的实体库,基于所述实体库和所述待验证信息进行比较,确定与所述待验证信息关联度最高的标准信息;假设标准库中的标准信息M的三元组集合表示为,n为三元组的总个数,其中,第个三元组为:,和分别表示两个实体,表示两个实体之间的关系;将实体间关系去除,只保留主实体和客实体后,得到该标准信息的实体对集合,,其中第个实体对;将所述待验证信息划分成m个句子,并对每个句子进行分词后,将所述待验证信息表示为:,表示第个句子,,其中,为第个句子中第x个分词;基于所述实体库和所述待验证信息进行比较,若所述待验证信息第个句子的分词中至少完全包含一个所述标准信息的实体对,则记,否则记0;则对于第个标准信息,其与所述待验证信息的关联度;步骤2,对所述待验证信息进行三元组提取,将所述待验证信息每个句子中的主实体和客实体与所述关联度最高的标准信息的实体对进行对应,基于关系抽取模型抽取所述待验证信息的实体对的关系,得到待验证信息的三元组集合;所述将所述待验证信息每个句子中的主实体和客实体与所述标准信息的实体对进行对应,若所述待验证信息第个句子的分词中至少完全包含一个所述关联度最高的标准信息的实体对,则将句子对应的所述关联度最高的标准信息的实体对中对应的主实体和客实体标记为所述待验证信息第个句子的主实体和客实体;若所述待验证信息第个句子的分词中不满足至少完全包含一个所述标准信息的实体对,则不对该句进行关系抽取;所述关系抽取模型为带有关系过滤器的二维实体抽取模型,包括线性层、池化层和输出层;将所述待验证信息的每个句子依次输入二维实体抽取模型,得到所述待验证信息的三元组集合;步骤3,将所述待验证信息的三元组集合和所述关联度最高的标准信息的三元组集合进行比较,得到所述待验证信息与标准信息的一致性检验结果;记与所述待验证信息关联度最高的标准信息为,则其与所述待验证信息的关联度,表示所述待验证信息第个句子,m为所述待验证信息的句子总数;记所述待验证信息的三元组集合为,记所述关联度最高的标准信息的三元组集合为,两个三元组集合之间的相似度,其中,是待验证信息的三元组集合的向量表示,是三元组集合为的向量表示;所述待验证信息与标准信息的一致性定量计算结果。
全文数据:
权利要求:
百度查询: 中国标准化研究院 一种标准信息要素一致性检验方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。