首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

CDKN2A/B纯合性缺失的分析方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京乐土医学检验实验室有限公司

摘要:本发明实施例公开了一种CDKN2AB纯合性缺失的分析方法及系统,获取一定数量的单肿瘤样本,并用FISI进行检测,确定样本的CNKN2AB纯杂合性缺失类型作为金标准;对单肿瘤样本进行测序处理,得到单肿瘤样本对应的测序数据,并对测序数据进行预处理;基于预处理后的测序数据确定单肿瘤样本的CDKN2AB区域碱基序列,并提取深度特征和提取kmer特征;基于深度特征和kmer特征获取最终特征变量,将最终特征变量和FISH确定的纯杂合性缺失类型作为Catboost模型的输入、对Catboost模型进行训练,训练后的模型可进行未知样本的纯杂合性预测。该CDKN2AB纯合性缺失的分析方法解决现有技术中无法准确且高效分析CDKN2AB纯合性缺失的问题。

主权项:1.一种CDKN2AB纯合性缺失的分析方法,其特征在于,所述方法具体包括:获取一定数量的单肿瘤样本,其中,所述单肿瘤样本包括杂合性缺失样本、野生型样本和纯合性缺失样本;对所述单肿瘤样本进行测序处理,得到所述单肿瘤样本对应的测序数据,并对所述测序数据进行预处理;基于预处理后的测序数据确定所述单肿瘤样本的CDKN2AB区域碱基序列,并提取深度特征和kmer特征;将所述深度特征和所述kmer特征进行合并,组成一个矩阵,基于样本类别对所述矩阵进行拆分,得到与所述样本类别数量对应的小矩阵,计算小矩阵的组间标准差与组内标准差,提取组间标准差大于预设值且组内标准差小于预设值的特征作为最终特征变量,包括:基于组间标准差构建组间差异矩阵,其中,所述组间差异矩阵第一列为矩阵的列名,第二列为组间标准差的均值;基于组内标准差构建组内差异矩阵,其中,所述组内差异矩阵第一列为矩阵的列名,第二列为组内标准差的均值;提取组间差异矩阵和组内差异矩阵第一列相同的部分,将相同的部分与第二列相除,得到差异系数;将差异系数按照从大到小进行排序,以构建差异列表;提取所述差异列表的第一列作为候选变量;提取矩阵中包含所述候选变量的列,按照候选变量从上到下的顺序,构建一个新矩阵;通过所述新矩阵对Catboost模型进行训练,并计算训练完成后的所述Catboost模型的平均准确率;基于最大平均准确率对应的新矩阵获取最终特征变量;将所述最终特征变量、最终特征变量对应的样本类型作为Catboost模型的输入,对所述Catboost模型进行训练;将待检测CDKN2AB纯合性缺失的单肿瘤数据对应的目标特征变量输入至训练完成的Catboost模型中,输出所述单肿瘤数据对应的类型,其中,所述类型包括杂合性缺失、野生型和纯合性缺失。

全文数据:

权利要求:

百度查询: 北京乐土医学检验实验室有限公司 CDKN2A/B纯合性缺失的分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。