买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南开大学
摘要:本发明公开了一种推断空间转录组内细胞亚群表达模式的方法及系统,涉及生物信息学空间转录组测序数据分析技术领域。本发明包括对scRNA‑seq数据集进行质量控制和预处理,得到细胞亚群表达矩阵;对细胞亚群表达矩阵进行标准化和归一化;构建变分神经网络,以学习scRNA‑seq数据集中每个细胞亚群的隐变量分布;在训练好的隐变量分布中进行采样,生成细胞亚群的表达模式;基于所述的细胞亚群的表达模式,对空间转录组组织切片中所有空间域的表达模式进行解卷积,得到细胞亚群在空间域中分布的最大后验估计。本发明使空间转录组中解卷积法所需单细胞参考数据在降低维度的同时,保留大量有关信息,提高解卷积方法的运行速度和准确性,使细胞在组织切片内的分布更加精确。
主权项:1.一种推断空间转录组内细胞亚群表达模式的方法,其特征在于,包括:对scRNA-seq数据集进行质量控制和预处理,得到细胞亚群表达矩阵;构建变分神经网络,以学习scRNA-seq数据集中每个细胞亚群表达矩阵的隐变量分布;在训练好的隐变量分布中进行采样,生成细胞亚群的表达模式;基于所述的细胞亚群的表达模式,对空间转录组组织切片中所有空间域的表达模式进行解卷积,得到细胞亚群在空间域中分布的最大后验估计,具体的:采用10XVisium测序技术得到的FFPE_Kidney空间转录组数据Y,通过空间聚类方法,为组织切片划分区域,将和Y作为解卷积方法的输入,输出每个区域内中每个细胞亚群所占的比例;所述对scRNA-seq数据集进行质量控制和预处理,包括:过滤基因含量过低的细胞以及未在细胞中表达的基因和线粒体基因,并筛选出高表达的基因;构建变分神经网络,以学习scRNA-seq数据集中每个细胞亚群表达矩阵的隐变量分布方法如下:对于一个预处理后的单细胞转录组基因表达矩阵,首先输入一层由全连接层组成的编码器,输出为和;再从高斯分布中进行采样得到隐变量Z,最后通过一层由全连接层组成的解码器生成最终的参考数据;变分神经网络的公式表示如下: 其中,和分别表示编码器和解码器的隐藏层;和表示隐空间高斯分布的参数;表示隐变量;表示细胞亚群重建后的表达矩阵;设定激活函数、损失函数和重参数化方法;所述损失函数表达式为: 其中,用于表示和的占比。
全文数据:
权利要求:
百度查询: 南开大学 一种推断空间转录组内细胞亚群表达模式的方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。