首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于扩张因果图嵌入的垂直领域大语言模型训练方法 

申请/专利权人:北京海纳数聚科技有限公司

申请日:2024-04-16

公开(公告)日:2024-06-25

公开(公告)号:CN118052291B

主分类号:G06N5/04

分类号:G06N5/04;G06N5/022;G06F17/15

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.06.04#实质审查的生效;2024.05.17#公开

摘要:本申请提供了一种基于扩张因果图嵌入的垂直领域大语言模型训练方法。本申请通过,获取目标垂直领域对应的垂直领域数据集,并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱;获取通用领域的生成式预训练转换器模型,并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层,得到对应的图嵌入模型;将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型,以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系,使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练,得到所述目标垂直领域对应的垂直领域模型。从而改善模型的输出效果。

主权项:1.一种基于扩张因果图嵌入的垂直领域大语言模型训练方法,其特征在于,所述方法包括:获取目标垂直领域对应的垂直领域数据集,并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱;获取通用领域的生成式预训练转换器模型,并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层,得到对应的图嵌入模型;将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型,以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系,使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练,得到所述目标垂直领域对应的垂直领域模型;其中,所述在所述生成式预训练转换器模型中嵌入扩张因果图注意力层,得到对应的图嵌入模型,包括:在所述生成式预训练转换器模型中的编码器输入端、编码器输出端以及解码器输入端嵌入所述扩张因果图注意力层,其中,位于所述编码器输入端、所述编码器输出端以及所述解码器输入端的扩张因果图注意力层采用参数共享机制共享权重矩阵;所述基于所述垂直领域知识图谱挖掘实体深层次关系,包括:通过公式一基于所述垂直领域知识图谱中节点间的1-hop邻接矩阵,计算k-hop邻接矩阵;公式一:;其中,为1-hop邻接矩阵,为k-hop邻接矩阵,k为1-hop邻接矩阵的次方;针对所述垂直领域知识图谱中的每个节点,基于所述k-hop邻接矩阵确定与所述节点存在k-hop邻接关系的邻接节点;通过公式二计算每个邻接节点与所述节点之间的注意力系数;公式二:;其中,为节点i的向量表示,为与节点i存在k-hop邻接关系的邻接节点j的向量表示,为的注意力系数,用于衡量邻接节点j对节点i的重要性,是可学习的权重矩阵,为内积核函数;通过公式三对所述注意力系数进行规范化处理;公式三:;其中,为规范化处理后的注意力系数,k-hopi表示节点i在k-hop上的邻接节点集合;通过公式四基于规范化处理后的所述注意力系数、所述权重矩阵及所有邻接节点,计算所述节点对应的实体深层次关系;公式四;其中,为节点i对应的实体深层次关系,为激活函数。

全文数据:

权利要求:

百度查询: 北京海纳数聚科技有限公司 一种基于扩张因果图嵌入的垂直领域大语言模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。