首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】具有噪声区域过滤的甲基化片段概率噪声模型_格瑞尔有限责任公司_202280063118.1 

申请/专利权人:格瑞尔有限责任公司

申请日:2022-09-16

公开(公告)日:2024-06-14

公开(公告)号:CN118202414A

主分类号:G16B20/00

分类号:G16B20/00;G16B40/20;G16H50/20

优先权:["20210920 US 63/246,030"]

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:公开了用于训练癌症分类器的系统和方法。方法包括针对包括多个甲基化序列读段的每个训练样本:对于每个甲基化序列读段,将多个基因组区域中与甲基化序列读段重叠的基因组区域所对应的概率噪声模型应用于甲基化序列读段来确定异常得分,异常得分指示在健康样本中观察到甲基化模式的似然值。每个概率噪声模型使用来自健康样本的甲基化序列读段进行训练。方法包括基于与异常得分低于阈值异常得分的基因组区域重叠的甲基化序列读段的计数,确定包括每个基因组区域的特征的特征向量。方法包括使用训练样本的特征向量,训练癌症分类器以基于输入特征向量来确定癌症预测。

主权项:1.一种用于训练癌症分类器的方法,所述方法包括:训练概率噪声模型,所述概率噪声模型通过来自健康样本的第一多个甲基化序列读段中的甲基化CpG位点的测量的均值和离差,针对基因组的多个基因组区域中的每个基因组区域而被参数化;针对每个训练样本,通过应用经训练的概率噪声模型,确定来自所述训练样本的多个甲基化序列读段中的每一个甲基化序列读段的异常得分,所应用的经训练的概率噪声模型与和所述甲基化序列读段重叠的所述基因组区域相关联;针对每个训练样本,通过将所述甲基化序列读段的所述异常得分与阈值异常得分进行比较,确定所述多个基因组区域中的每个基因组区域中异常甲基化片段的计数;针对每个训练样本,为所述多个基因组区域中的每个基因组区域,确定所述基因组区域中异常甲基化片段的所述计数与所述基因组区域中甲基化序列读段总数的比率;针对每个训练样本,生成特征向量,所述特征向量包括所述多个基因组区域之上的所述比率;以及训练分类器以使用所述训练样本的所述特征向量来确定癌症预测。

全文数据:

权利要求:

百度查询: 格瑞尔有限责任公司 具有噪声区域过滤的甲基化片段概率噪声模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。