一种基于大数据遗传代谢病筛查效率提升的智能分析方法

导航：龙图腾网> 最新专利技术> 一种基于大数据遗传代谢病筛查效率提升的智能分析方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学

摘要：本发明提供一种基于大数据智能分析的遗传代谢病筛查效率提升方法，通过大数据的智能分析，进行遗传代谢病风险评估，提高遗传代谢病筛查结果的准确度，实现遗传代谢病筛查分析的规范化和标准化，将多种影响因素降低到最小程度，有效降低了各遗传代谢病筛查的召回率，提升检出率，对降低出生缺陷，降低筛查假阳性率，提高检测结果准确率，提高出生人口素质具有重大意义。本发明克服目前临床上通过遗传代谢病专业人员基于个人经验进行结果解读，但由于缺乏标准化和规范化，不同人员对同一检测结果的解读差异较大，存在较高假阳性率及假阴性率等问题，有效利用医疗资源。

主权项：1.一种基于大数据智能分析的遗传代谢病筛查效率提升方法得到的疾病判断模型，其特征在于，通过以下步骤实现：1样本数据收集：样本数据分为两部分，一部分为正常样本数据，另一部分为确诊样本数据，数据包括样本居住地、母亲年龄、孕周、出生体重、采血间隔以及MSMS串联质谱检测的指标浓度；2数据预处理：将数据进行数据整理、样本去重、剔除串列数据、去除标签性异常数据、修改更正错误的疾病标签，将指标浓度值按地区进行分类，分别进行地区标准化中位数倍数MoM值处理，中位数倍数MoM值标准化计算方法如下：中位数倍数MoM＝地区串联指标绝对值对应地区对应人口特征值的中位数；3特征筛选：使用方差选择、线性相关性选择、非线性相关性选择、信息增益法进行特征筛选，排除无效或冗余的特征，把特异性强，能够较好地区分正常样本和确诊样本的指标作为特征挑选出来作为模型的训练数据；4特征提取：使用AUC特征提取法、Ripper规则提取法对筛选的特征数据进行分析比较，找出在检出率接近100％且假阳性率接近0％的特征；5特征组合确定在上述AUC或者Ripper挑选的规则中提取出满足条件的特征，使用特征和与特征积以检出率为1，假阳性率最低为目标对特征进行挑选，结合特征积和特征和的结果，得到最终的疾病判断模型；其中步骤4中：a：AUC特征提取法：利用ROC曲线计算曲线下面积AUC，AUC越高，则表示该特征的特异性越好，ROC是通过遍历每个特征的值，观察检出率随着假阳性率的分布，检出率越高，假阳性率越低说明特征越好，为了量化特征的重要性，计算AUC，比较不同切值下的检出率和假阳性率，并且可以发现在检出率为1情况下，假阳性率的大小，AUC的计算方式如下，其中代表第i条样本的序号，M、N分别代表正样本的个数和负样本的个数： b：Ripper规则提取法：Ripper能很好地处理噪声数据集，分类的时候，将规则库中的规则根据添加的先后顺序一一与实例匹配，若匹配成功则实例被预测为正例，若都不匹配则为负例，分为5个阶段：第1阶段：准备阶段计算每个类别的先验概率，假设完整的数据集为D，每次对一个类别的数据建立规则并加入到规则库中：如完整数据集的类C1,C2,…Cn先验概率为p1≤p2≤…≤pn，那么首先对C1建立规则，规则建立完成后将其覆盖的数据从D中删除；第2阶段：规则生成输入数据集D，正例类别C与其先验概率p，在这个阶段中，将生成若干条规则直到无法继续，这些规则的后件都是类别C，每一条规则的生成都经历增长和剪枝两个阶段，数据集D分为独立的增长集Grow与修剪集Prune；第3阶段：规则增长使用的数据集为增长集Grow，则的增长从空规则开始，其每次在所有可能的属性与阈值之间挑选合适的组合作为前件添加到规则之中，度量的标准是信息增益，不同于其他决策树，这里的信息增益并非期望熵的减少，而是来源于信息论里对一个正例编码所需比特的减少，这里的信息增益的准确定义为：Gainantd＝coverlog2rt′-log2rt，其中cover指规则添加前件antd后覆盖到的正例数量，rt′指添加前件后规则覆盖的数据中的正例比例，rt则是未添加前件的，每一次添加前件都需要对所有候选阈值计算其所带来的信息增益并选择最高的一个添加到规则中，每添加一个前件，都需要将其所覆盖的数据从增长集中删去，添加前件的循环将持续进行，直到Grow为空，或者余下的Grow中已经没有正例，或者没有更多的候选阈值，或者规则的覆盖率低于某个值；第4阶段：规则修剪修剪阶段使用修剪集Prune来检验规则的泛化能力，从最后一项被添加的前件开始往前依次删去规则的一个前件，计算其在修剪集上的准确率，算法选择准确率最高且前件尽可能少的规则，但该规则的准确率至少要比空规则高，记待修剪的规则为R＝a1,a2,…a6，剪枝时度量标准是最大化p-np+n，其中p是修剪集中被规则覆盖的正例，n是被规则覆盖的负例；第5阶段：规则优化将数据集D划分为Grow和Prune，从空规则开始，利用Grow生成规则并剪枝，对于每个Prune中的每个实例，如果其被规则库中R以后的任意规则覆盖，则将其从Prune删除，剪枝时计算，将新规则覆盖的样本删除后，用剩余的样本进行剪枝，计算整个修剪集上的正确率，去除被新规则覆盖的数据后，计算剩余数据里的正确率；其中步骤5所述的特征和：将特征一个个删除，求剩下的特征的和，将这些特征和表示异常程度，以检出率为1，假阳性率最低为目标，循环的删除特征，剔除使假阳性率升高的特征，留下假阳性率最低时的特征组合，将上述留下的特征，进行随机组合，还是以这些特征和表示异常程度，最终得到检出率为1时，假阳性率最低的特征组合A；其中步骤5所述的特征积：将特征一个个删除，求剩下的特征的积，将这些特征积表示异常程度，以检出率为1，假阳性率最低为目标，循环的删除特征，剔除使假阳性率升高的特征，留下假阳性率最低时的特征组合，将上述留下的特征，进行随机组合，还是以这些特征积表示异常程度，最终得到检出率为1时，假阳性率最低的特征组合B；最后结合这两种构造的特征进行疾病判断值C，将这两种特征进行乘积处理后作为疾病的风险，公式为：C＝A*B。

全文数据：

权利要求：

百度查询：浙江大学一种基于大数据遗传代谢病筛查效率提升的智能分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种多工位双面印刷装置

下一篇：双驱动可变电容器

相关技术

一种多工位双面印刷装置

双驱动可变电容器

室内外一体化高精度定位引擎

一种快拆汽车水泵叶轮

用于质检排班的数据库管理方法、计算机设备及计算机可读存储介质

一种螺杆轴头泵

一种常压硫酸储罐腐蚀检测装置

一种髋臼盂唇切除器

低散射辐射单元及多频共口径天线阵列

一种无印记的袋布结构

悬挂式生物质往复炉排

一种滚筒杀青机

效率相关技术

一种高效率除杂磁选装置_茌平县金晶耐磨材料有限公司_202410637775.3

一种提高筛选效率的振动筛_广西武宣桂明钙镁材料科技有限公司_202420131929.7

能够提高油墨烘干效率的印刷机构_邵武市天福包装彩印有限公司_202420316900.6

一种高效率布袋除尘器_包头市泽润机械设备有限责任公司_202411041557.X

可提升生产效率的鳍片上料装置_惠州市凯亿鑫智能装备有限公司_202323626169.1

一种高效率气固反应装置_镇江普耀新材料有限公司_202420312610.4

一种提高装配效率的瓶盖_浙江晶屹实业有限公司_202420140997.X

高效率长寿命通井牙轮钻头_天津立林钻头有限公司_202323021281.2

一种用于高效率加工的流量计夹具_无锡禹田真空设备有限公司_202420138346.7

一种关断时间控制的高效率降压型开关电源电路_福建农林大学_202410702449.6

筛相关技术

一种离子筛预处理方法、离子筛及其应用_重庆鑫景特种玻璃有限公司_202211406760.3

一种分筛设备_万耀维盛(青岛)宠物食品有限公司_202322999025.4

一种方形摇摆筛_新乡市中宇机械设备有限公司_202420297053.3

一种耐火材料生产用滚筒筛_登封市中豫耐材科技有限公司_202420184274.X

一种PBT生产用筛料装置_江苏阿科米科技有限公司_202411189126.8

一种高容量振动筛_云南坤天新能源有限公司_202420114719.7

一种病毒快速筛查检测方法_苏州谱安纳科技有限公司_202410608430.5

一种石墨高效多级分筛装置_山东海金石墨科技有限公司_202411187624.9

一种建筑施工用筛沙装置_绍兴如是建筑工程设计有限公司_202323417214.2

一种分子筛加热设备_无锡市三晓新材料有限公司_202323519648.3

查相关技术

一种消化道肿瘤粪便筛查采集检测装置_河南省肿瘤医院_202010204581.6

高压电力电缆缓冲层烧蚀隐患电缆段筛查方法_国网天津市电力公司电力科学研究院_202110007611.9

一种舒适型经鼻胃管镜筛查管_上海交通大学_202111497451.7

一种产前筛查数据采集分析系统及方法_吉林大学_202411069157.X

一种筛查致癌性化学品的集成学习方法_大连理工大学_202210316494.9

一种基于神经-免疫作用的抗食物过敏筛查模型的构建方法及其应用_南昌大学_202411060184.0

查尔酮在防治棉花黄萎病中的应用及防治棉花黄萎病的方法_新疆农业大学_202410827315.7

一种基于大数据遗传代谢病筛查效率提升的智能分析方法_浙江大学_202111287286.2

一种基于视听数据分析的可交互式抽动障碍辅助筛查系统_山东第二医科大学_202410681852.5

一种超声扫查三维重建系统及三维重建方法_航科新世纪科技发展(深圳)有限公司_202311622042.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大数据遗传代谢病筛查效率提升的智能分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务