首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种整合空间转录组多模态信息的空间域识别方法_太原理工大学;中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)_202410419410.3 

申请/专利权人:太原理工大学;中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)

申请日:2024-04-09

公开(公告)日:2024-06-18

公开(公告)号:CN118016149B

主分类号:G16B20/00

分类号:G16B20/00;G16B25/10;G16B40/30;G06V20/69;G06N3/042;G06N3/0455;G06N3/0464;G06F18/2135;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本发明提供了一种整合空间转录组多模态信息的空间域识别方法,属于空间转录组学技术领域;解决了现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题;包括如下步骤:获取数据集;数据集加载与预处理;图像切割和形态特征提取;通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,然后结合基因表达矩阵构建空间图、特征图和形态图;搭建由多通道图卷积自编码器MCGCN和NB解码器Decoder构成的空间域识别模型并训练,得到潜在嵌入特征;对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别;本发明应用于空间转录组学空间域识别。

主权项:1.一种整合空间转录组多模态信息的空间域识别方法,其特征在于:包括如下步骤:步骤1:获取数据集,所述数据集通过空间转录组测序技术测量得到,所述数据集中包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息;步骤2:数据集加载与预处理:对基因表达数据和空间位置信息进行预处理;步骤3:图像切割和形态特征提取:通过对组织切片图像进行切割,使用预训练的卷积神经网络提取形态特征向量,得到形态学信息;步骤4:通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,然后结合基因表达矩阵构建空间图、特征图和形态图;步骤5:图保存与数据处理;步骤6:搭建由多通道图卷积自编码器MCGCN和NB解码器Decoder构成的空间域识别模型,将预处理后的数据输入搭建到的空间域识别模型进行训练,得到潜在嵌入特征;所述多通道图卷积自编码器MCGCN由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成,其生成低维嵌入的方式如下:1空间卷积模块是对空间图进行卷积运算,应用以下分层传播规则来生成低维嵌入Es,其表达式如下: ;其中As是空间邻接矩阵,X是节点属性特征矩阵,是空间卷积模块中第l层的权重参数,是空间卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的代表基因表达矩阵,是空间图中对称归一化的邻接矩阵,其计算公式如下: ;其中代表As度矩阵;2特征卷积模块对特征图进行卷积运算,应用以下分层传播规则来生成低维嵌入Ef,其表达式如下: ;其中Af是特征邻接矩阵,是特征卷积模块中第l层的权重参数,是特征卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的代表基因表达矩阵,是特征图中对称归一化的邻接矩阵,其计算公式如下: ;其中代表Af度矩阵;3形态卷积模块对形态图进行卷积运算,应用以下分层传播规则来生成低维嵌入Em,其表达式如下: ;其中Am是形态邻接矩阵,是形态卷积模块中第l层的权重参数,是形态卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的代表基因表达矩阵,是特征图中对称归一化的邻接矩阵,其计算公式如下: ;其中代表Am度矩阵;4引入协同卷积模块用于三个图的协同卷积,提取基于空间图的共同嵌入Ecs、基于特征图的共同嵌入Ecf和基于形态图的共同嵌入Ecm,其表达式分别如下: ; ; ;其中是协同卷积模块中第l层的权重参数,、和是分别从空间图、特征图、形态图中提取的共同嵌入,、和分别代表空间图、特征图、形态图中对称归一化的邻接矩阵,下标c表示协同卷积模块;通过上述计算到的、和定义共嵌入为: ;一致性约束损失Lcon的表达式如下: ;上式中:是从空间图提取的嵌入,是从特征图提取的嵌入,是从形态图中提取的嵌入;步骤6中搭建的空间域识别模型,引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN生成的基于空间图的低维嵌入Es、基于特征图的低维嵌入Ef、基于形态图的低维嵌入Em以及共嵌入Ec的重要性以生成相应的权重参数ωs、ωf、ωm和ωc,通过权重参数生成最终的低维嵌入Efinal,权重参数的生成过程如下: ; ;所述NB解码器Decoder结合了负二项分布来建模数据的分布特征,基于负二项分布模型,考虑了基因表达数据的离散性和变异性,重建基因表达矩阵,以捕获ST数据的复杂全局信息,NB解码器Decoder的构成如下:首先定义一个包含一个线性层和一个批量归一化层的中间层,用于将编码器输出的低维嵌入Efinal映射到一个更高维度的空间,采用ReLU激活函数,用于引入非线性,定义两个线性层分别对中间层的输出进行映射到原始维度,得到分布的离散度θ和均值μ;对于给定的基因表达矩阵X,假设其符合负二项分布,基因表达的概率分布fNB定义如下: ;其中离散度θ和均值μ由解码器计算得到,Γ表示伽马函数;为了最小化预测值与真实值之间的差异,采用负对数似然估计作为原始基因的重建损失LNB_rec,定义如下: ;步骤7:对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别。

全文数据:

权利要求:

百度查询: 太原理工大学;中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心) 一种整合空间转录组多模态信息的空间域识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。