首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Transformer模型预测的单细胞RNA测序数据聚类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:长春师范大学

摘要:本发明公开了一种基于Transformer模型预测的单细胞RNA测序数据聚类方法,所述方法包括如下步骤:步骤1)获取单细胞RNA测序数据;步骤2)数据预处理;步骤3)基于PCA和K‑means的细胞簇类识别;步骤4)基于加权集成的元聚类方法处理;步骤5)计算投票置信度划分训练集;步骤6)引入基于Transformer模型的训练和预测。本发明的方法不仅能够克服现有方法在数据整合和一致性分析、细胞聚类的准确性和稳定性以及细胞聚类计算效率方面存在的问题,而且能够提高单细胞RNA测序数据分析的效率和准确性,准确识别和分类单细胞数据中的细胞类型,为细胞组学研究和生物医学应用提供更可靠的数据支持。

主权项:1.一种基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述方法包括如下步骤:步骤1)获取单细胞RNA测序数据:从公共数据库获取公开的单细胞RNA测序数据集;步骤2)数据预处理:步骤21)对于步骤1)获取到的单细胞RNA测序数据,使用R包Seurat中的SCTransform函数对其进行预处理;步骤22)将经过SCTransform处理后的Seurat对象中的标准化表达数据保存到新的CSV文件中;步骤3)基于PCA和K-means的细胞簇类识别:步骤31)从步骤2)预处理后的基因表达矩阵中加载数据;步骤32)确定要进行降维的目标维度集合,针对每个维度值,依次对基因表达矩阵进行PCA降维,将高维的基因表达数据转换为低维的特征空间;步骤33)在降维的数据上分别应用K-means聚类算法,将细胞样本划分为预先定义K值的簇;步骤34)将每个维度下得到的聚类结果整合;步骤4)基于加权集成的元聚类方法处理:步骤41)计算细胞权重;步骤42)计算加权簇间相似度;步骤43)基于加权簇间相似度矩阵进行聚类;步骤44)通过投票方案确定最终结果;步骤5)计算投票置信度划分训练集:步骤51)每个细胞根据在多次聚类中被分配到的簇,进行投票;步骤52)根据每个簇类的得票数,得出每个细胞在各个簇类上的置信度,拥有最高置信度的簇类被指定为细胞的所属簇类;步骤53)对每个簇类中的细胞对应的置信度进行排序,并将置信度高的前30%的细胞提取出作为Transformer模型的训练集;步骤6)引入基于Transformer模型的训练和预测:步骤61)将每个簇中置信度高的前30%的细胞以及每个簇类包含的所有细胞分别作为训练集和验证集;步骤62)构建Transformer模型,并使用训练集数据对构建的Transformer模型进行训练;步骤63)使用训练好的Transformer模型对预处理过的基因表达矩阵进行处理,对每个细胞样本进行聚类标签的预测,同时,将预测结果保存为一个新的聚类标签结果,供后续的数据分析和应用使用。

全文数据:

权利要求:

百度查询: 长春师范大学 基于Transformer模型预测的单细胞RNA测序数据聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。