一种基于扩张因果图嵌入的垂直领域大语言模型训练方法

导航：龙图腾网> 最新专利技术> 一种基于扩张因果图嵌入的垂直领域大语言模型训练方法

申请/专利权人：北京海纳数聚科技有限公司

申请日：2024-04-16

公开（公告）日：2024-06-25

公开（公告）号：CN118052291B

主分类号：G06N5/04

分类号：G06N5/04;G06N5/022;G06F17/15

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本申请提供了一种基于扩张因果图嵌入的垂直领域大语言模型训练方法。本申请通过，获取目标垂直领域对应的垂直领域数据集，并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱；获取通用领域的生成式预训练转换器模型，并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层，得到对应的图嵌入模型；将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型，以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系，使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练，得到所述目标垂直领域对应的垂直领域模型。从而改善模型的输出效果。

主权项：1.一种基于扩张因果图嵌入的垂直领域大语言模型训练方法，其特征在于，所述方法包括：获取目标垂直领域对应的垂直领域数据集，并基于所述垂直领域数据集构建所述目标垂直领域对应的垂直领域知识图谱；获取通用领域的生成式预训练转换器模型，并在所述生成式预训练转换器模型中嵌入扩张因果图注意力层，得到对应的图嵌入模型；将所述垂直领域数据集和所述垂直领域知识图谱一起输入至所述图嵌入模型，以由所述图嵌入模型中的扩张因果图注意力层基于所述垂直领域知识图谱挖掘实体深层次关系，使所述图嵌入模型基于所述实体深层次关系和所述垂直领域数据集进行模型训练，得到所述目标垂直领域对应的垂直领域模型；其中，所述在所述生成式预训练转换器模型中嵌入扩张因果图注意力层，得到对应的图嵌入模型，包括：在所述生成式预训练转换器模型中的编码器输入端、编码器输出端以及解码器输入端嵌入所述扩张因果图注意力层，其中，位于所述编码器输入端、所述编码器输出端以及所述解码器输入端的扩张因果图注意力层采用参数共享机制共享权重矩阵；所述基于所述垂直领域知识图谱挖掘实体深层次关系，包括：通过公式一基于所述垂直领域知识图谱中节点间的1-hop邻接矩阵，计算k-hop邻接矩阵；公式一：；其中，为1-hop邻接矩阵，为k-hop邻接矩阵，k为1-hop邻接矩阵的次方；针对所述垂直领域知识图谱中的每个节点，基于所述k-hop邻接矩阵确定与所述节点存在k-hop邻接关系的邻接节点；通过公式二计算每个邻接节点与所述节点之间的注意力系数；公式二：；其中，为节点i的向量表示，为与节点i存在k-hop邻接关系的邻接节点j的向量表示，为的注意力系数，用于衡量邻接节点j对节点i的重要性，是可学习的权重矩阵，为内积核函数；通过公式三对所述注意力系数进行规范化处理；公式三：；其中，为规范化处理后的注意力系数，k-hopi表示节点i在k-hop上的邻接节点集合；通过公式四基于规范化处理后的所述注意力系数、所述权重矩阵及所有邻接节点，计算所述节点对应的实体深层次关系；公式四；其中，为节点i对应的实体深层次关系，为激活函数。

全文数据：

权利要求：

百度查询：北京海纳数聚科技有限公司一种基于扩张因果图嵌入的垂直领域大语言模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种双向限位器

下一篇：一种薄荷醇制取用原料粉碎装置

相关技术

一种双向限位器

一种薄荷醇制取用原料粉碎装置

一种纸箱印刷机用送料装置

一种房建施工用安全防坠装置

一种数控机床主轴箱冷却装置

一种地铁车辆车钩检修用辅助工具

一种管道开槽定位工装

一种低交叉极化抑制的宽带UWB天线及穿戴设备

一种可移动式智能温控糖化槽生产线

混料搅拌装置

一种巡检方便的电容补偿柜

一种用于3C零件组装的点胶设备

垂直相关技术

一种垂直传送式烤箱_善用智能(东莞)机器人有限公司_202322987202.7

一种便于拆卸的垂直筛孔塔盘_无锡市华诚石化设备有限责任公司_202323089933.6

一种房屋建设垂直测量装置_中国公路工程咨询集团有限公司_202322988153.9

一种室外垂直景观绿化墙_温州振东园林工程有限公司_202322870229.8

一种极板垂直度检测装置_阳新弘盛铜业有限公司_202410556407.6

一种钢构件垂直度测量装置_上海城校工程检测有限公司_202323168952.8

一种分体式垂直压缩站_徐工湖北环保科技股份有限公司_202410627986.9

垂直搅拌器的搅拌机构_蚌埠凯盛工程技术有限公司_201910931975.9

平原软土地区河道垂直防渗节制闸_天津市水务规划勘测设计有限公司_202322939846.9

相机模组调节水平垂直度机构_万润科技精机(昆山)有限公司_202323195847.3

领域相关技术

半导体领域用石墨材料表面防腐蚀复合涂层制备方法_基迈克材料科技(苏州)有限公司_202311866332.3

一种重症领域知识自动抽取的实现方法及系统_青岛市中心医院_202410439025.5

基于大模型的垂直领域的问答方法及系统_甄觉科技(上海)有限公司_202410299787.X

一种应用于半导体领域的实例检索方法和装置_苏州芯联成软件有限公司_202410448502.4

一种自动化宽领域溶液发生的配气系统_山西新华防化装备研究院有限公司_202323044946.1

一种细分领域增强的隐式篇章关系识别方法_华东交通大学_202410488368.0

一种自适应的领域词典自动构建方法_慧医大数据技术(深圳)有限公司_202211699263.7

一种用于航空领域的主起落架的搬移装置_中安(天津)航空设备有限公司_201810759143.9

面向金融领域的语音数据分类分级方法及系统_哈尔滨理工大学_202410406097.X

基于事件本体的有机太阳能电池领域实验建模方法及系统_中国科学院成都文献情报中心_202311554726.5

嵌入相关技术

一种嵌入式LED球泡灯_江门市天衍照明科技有限公司_202420183915.X

一种嵌入式触摸屏_佛山市顺德区技强电子有限公司_202322452987.8

一种LED嵌入式筒灯_无锡市益明光电有限公司_202322974357.7

低压铸造预嵌入钢套结构_六丰金属科技(昆山)有限公司_202322914103.6

用于内衬管道或通道的嵌入软管_英普瑞格股份有限公司_202280077017.X

一种嵌入式光伏电站_安徽吉电新能源有限公司_202322714319.8

一种嵌入式侧板灯_深圳市八斗光电科技有限公司_202322811987.2

基于标签特定特征与多重相关信息的嵌入式多标签分类方法_南京邮电大学_202410205503.6

一种基于嵌入式的电子标签阅读器_苏州鑫福耀智能科技有限公司_202322940956.7

电子芯片的嵌入式分流微通道散热器_东南大学_202410580371.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于扩张因果图嵌入的垂直领域大语言模型训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务