首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种筛选MSI特征位点的方法、装置和存储介质_苏州吉因加生物医学工程有限公司;北京吉因加医学检验实验室有限公司;上海吉因加医学检验实验室有限公司_202410008253.7 

申请/专利权人:苏州吉因加生物医学工程有限公司;北京吉因加医学检验实验室有限公司;上海吉因加医学检验实验室有限公司

申请日:2023-04-21

公开(公告)日:2024-04-02

公开(公告)号:CN117809744A

主分类号:G16B20/30

分类号:G16B20/30;G16B40/00;G06F18/214;G06F18/2113

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本申请公开了一种筛选MSI特征位点的方法、装置和存储介质。本申请方法包括,获取MSS样本集和MSI样本集;筛选获得重复单元重复次数≥7,且用于PCR检测MSI状态时用的位点;统计重复单元重复次数小于特定重复数n的模板簇占对应位点有效模板簇总数的比例作为重复数特征;将MSI样本的所有重复数特征除以肿瘤含量估计值,作为矫正后的重复数特征,并将矫正后大于1的重复数特征重置为1;最后,通过数据清洗步骤和MSI特征位点集合筛选步骤获得筛选的MSI特征位点。本申请方法获得的MSI特征位点能用于检测血浆样本微卫星状态,只需通过血浆对部分MSI位点进行检测即可,检测成本低、特异性强、敏感性高。

主权项:1.一种筛选MSI特征位点的方法,其特征在于:包括以下步骤,样本集合获取步骤,包括获取肿瘤组织检测为MSS的血浆样本作为MSS样本集,获取MSI的组织样本作为MSI样本集,分别获取MSS样本集和MSI样本集的比对文件;初始MSI特征位点集合构建步骤,包括根据样本集合获取步骤的样本集覆盖到的微卫星位点集合,筛选获得重复单元重复次数大于等于7的位点,并且用于PCR检测MSI状态时使用的位点;重复数特征获取步骤,包括根据UMI选取覆盖到对应位点,且支持模板数大于等于2的模板簇作为对应位点的有效模板簇集合;对于有效模板簇集合中的每个模板簇,随机选取两条模板,以两条模板中较大的重复数作为模板簇的重复数;分别统计重复单元重复次数小于特定重复数n的模板簇占对应位点有效模板簇总数的比例作为重复数特征,n取1至100的整数,使得每个位点产生100个可用的重复数特征,同时记录有效模板簇总数;MSI样本集重复数特征矫正步骤,包括根据公式1计算初始MSI特征位点集合构建步骤获取的位点集合中每个位点在MSS样本集合中的肿瘤含量计算特征feature_repeat;根据公式2计算初始MSI特征位点集合构建步骤获取的位点集合中的每个位点的单位点不稳定比例proportion;求取不同位点proportion的最大值作为样本肿瘤含量估计值;将MSI样本的所有重复数特征除以肿瘤含量估计值,作为矫正后的重复数特征,并将矫正后大于1的重复数特征重置为1;数据清洗步骤,包括,①过滤去除有效模板簇总数1000的MSS样本位点,过滤掉有效模板簇总数100的MSI样本位点;②经过滤后,将MSS样本中剩余位点比例0.5或MSI样本中剩余位点比例0.3的位点过滤掉;③过滤掉PCR位点确定的肿瘤含量40%的MSI样本;MSI特征位点集合筛选步骤,包括将重复数特征按照位点和重复数进行分组,使得每个位点每个重复数对应一组重复数特征;每组重复数特征按照公式3计算一个特征信号强度Signal_strength,使得每个位点每个重复数对应一个信号强度;对于每个位点,选取一个特征信号强度最大的重复数作为位点的特征重复数mvr,对应最大的特征信号强度作为位点信号强度,同时记录最大特征信号强度对应的MSS_ave作为位点基线mvb;筛选位点信号强度最大的15个位点作为MSI特征位点集合;公式1:feature_repeat=argmin{Sti1-Sai},0i≤100,Sai0.1;公式2:proportion=1-1-MSI_feature1-MSS_mean公式3:Signal_strength=MSI_0.25-MSS_aveMSS_std+0.0001公式1中,Sti与Sai是单个微卫星位点在MSS样本集中第i个重复数特征的标准差和平均值,feature_repeat为该位点所有Sti1-Sai取最小值时对应的i;公式2中,MSS_mean代表单个微卫星位点对应第feature_repeat个重复数特征在MSS样本集中的平均值,MSI_feature代表单个微卫星位点对应第feature_repeat个重复数特征在单个MSI样本上的取值;公式3中,MSS_std与MSS_ave是该组重复数特征在MSS样本集中去除最大3%异常重复数特征后的标准差和平均值,MSI_0.25为MSI样本集的重复数特征下四分位数。

全文数据:

权利要求:

百度查询: 苏州吉因加生物医学工程有限公司;北京吉因加医学检验实验室有限公司;上海吉因加医学检验实验室有限公司 一种筛选MSI特征位点的方法、装置和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。