买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯科技(深圳)有限公司
摘要:本申请涉及计算机技术领域,尤其涉及一种实体对象编码方法、装置、电子设备和存储介质,用以提高实体对象编码的准确性。其中,方法包括:获取待编码知识图谱中的各个实体对象;分别对各个实体对象进行编码,获得对应的实体嵌入特征,以及分别对各个实体对象的实体类别进行编码,获得对应的类别嵌入特征,其中,各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的;分别将各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合,获得各个实体对象对应的实体编码信息。本申请借助用于表示实体类别的本体知识,为数据量较少的实体对象进行指导,从而克服其误差,提升实体对象的编码质量,提高实体对象编码的准确度。
主权项:1.一种实体对象编码方法,其特征在于,该方法包括:获取待编码知识图谱中的各个实体对象,其中,所述待编码知识图谱包括所述各个实体对象之间的关联关系;基于已训练的实体对象编码模型,分别对所述各个实体对象进行编码,获得所述各个实体对象对应的实体嵌入特征,以及分别对所述各个实体对象的实体类别进行编码,获得所述各个实体对象的实体类别对应的类别嵌入特征,其中,所述各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的;分别将所述各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合,获得所述各个实体对象对应的实体编码信息;其中,训练所述实体对象编码模型时,每次循环迭代执行以下操作:从训练样本数据集中选取一组训练样本,所述一组训练样本包括:包含至少一对作为同义词的实体对象的第一样本知识图谱和第二样本知识图谱;将所述第一样本知识图谱和第二样本知识图谱输入所述实体对象编码模型,分别对所述第一样本知识图谱和第二样本知识图谱中的各个实体对象进行编码,基于获得的所述各个实体对象对应的预测实体嵌入特征,确定包含所述各个实体对象的三元组对应的向量差,所述预测实体嵌入特征为嵌入表示向量,其中,包含所述各个实体对象的三元组对应的向量差为所述三元组中的头实体对象嵌入表示向量以及关系嵌入表示向量的和,与尾实体对象嵌入表示向量的差;基于第一正样本对应的向量差和第一负样本对应的向量差,对所述实体对象编码模型进行参数调整,所述第一正样本为所述第一样本知识图谱或所述第二样本知识图谱中的三元组,所述第一负样本是通过随机替换所述第一正样本中的头实体对象或尾实体对象生成的。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 一种实体对象编码方法、装置、电子设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。