买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:磨石生物公司
摘要:一种用于鉴别可能呈递在受试者的肿瘤细胞表面上的新抗原的方法。通过对所述受试者的肿瘤细胞进行测序来获得肿瘤新抗原的肽序列。将每种新抗原的肽序列与受试者的核苷酸测序数据的多个k聚体单元中的一个或多个k聚体单元相关联;将所述肽序列和相关联的k聚体单元输入机器学习呈递模型中以产生所述肿瘤新抗原的呈递可能性,每个呈递可能性代表了新抗原由所述受试者的肿瘤细胞表面上的MHC等位基因呈递的可能性。基于所述呈递可能性选择所述新抗原的子集。
主权项:1.一种用于鉴别来自受试者的一种或多种肿瘤细胞的可能呈递于所述肿瘤细胞表面上的一种或多种新抗原的方法,所述方法包括以下步骤:从所述受试者的所述肿瘤细胞和正常细胞获得外显子组、转录组或全基因组核苷酸测序数据中的至少一种,其中所述核苷酸测序数据被用于获得代表通过比较来自所述肿瘤细胞的核苷酸测序数据和来自所述正常细胞的核苷酸测序数据鉴别的新抗原集合中每一种新抗原的肽序列的数据,其中每一种新抗原的肽序列包含至少一个使其不同于从所述受试者的正常细胞鉴别的相应野生型肽序列的变化;将每种新抗原的肽序列编码成相应的数字矢量,每个数字矢量包含有关构成所述肽序列的多个氨基酸和所述肽序列中氨基酸的位置集合的信息;将每种新抗原的肽序列与所述受试者的核苷酸测序数据的多个k聚体单元中的一个或多个k聚体单元相关联;使用计算机处理器将所述数字矢量和一个或多个相关联的k聚体单元输入机器学习呈递模型中,以产生对于该新抗原集合的呈递可能性集合,该集合中的每个呈递可能性代表了相应新抗原由所述受试者的肿瘤细胞表面上的一个或多个MHC等位基因呈递的可能性,所述机器学习呈递模型包含:至少基于训练数据集鉴别的多个参数,所述训练数据集包含:对于多个样品中的每个样品,通过质谱测量与被鉴别为存在于所述样品中的MHC等位基因集合中的至少一种MHC等位基因结合的肽的存在获得的标记;和对于每个样品,编码为包含有关构成所述肽的多个氨基酸和所述肽中氨基酸的位置集合的信息的数字矢量的训练肽序列;和对于每个样品,对于所述样品的每个训练肽序列,所述训练肽序列与所述训练肽序列的核苷酸测序数据的多个k聚体单元中的一个或多个k聚体单元之间的关联,其中多个参数的子集代表所述一个或多个k聚体单元的呈递热点的存在或不存在;以及代表作为输入接收的所述数字矢量和所述一个或多个k聚体单元与根据所述数字矢量、所述一个或多个k聚体单元和所述参数作为输出生成的所述呈递可能性之间的关系的函数;基于所述呈递可能性集合选择所述新抗原集合的子集,以产生选定的新抗原的集合;以及回收所述选定的新抗原的集合。
全文数据:
权利要求:
百度查询: 磨石生物公司 使用热点进行的新抗原鉴别
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。