恭喜大连理工大学李文耀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜大连理工大学申请的专利一种基于深度残差收缩网络的多组学与表型关联预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115132279B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210644640.0,技术领域涉及:G16B40/20;该发明授权一种基于深度残差收缩网络的多组学与表型关联预测方法是由李文耀;林恺;高建;张强;何昆仑;石金龙设计研发完成,并于2022-06-09向国家知识产权局提交的专利申请。
本一种基于深度残差收缩网络的多组学与表型关联预测方法在说明书摘要公布了:本发明公开一种基于深度残差收缩网络的多组学与表型关联预测方法。本发明首先通过差异分析对各组学高通量数据进行降维处理与排序,利用深度残差收缩神经网络学习组学和表型间的映射关系,在此基础上通过置信距离融合上述映射关系,结合主观逻辑的不确定方法实现预测,最后根据分类置信度反向推导出与表型联系最为紧密组学。本发明融合各个组学更能准确地表征复杂的人体生理活动,更客观地从多个维度分析和预测表型,同时考虑到组学数据的高维冗余特点设计了抗噪能力强的深度残差收缩神经网络,结合基于置信分数的主观逻辑多组学融合手段,使得本发明的预测性能相比现有方法在准确度、F1评分和AUC等评估指标上取得可观提升。
本发明授权一种基于深度残差收缩网络的多组学与表型关联预测方法在权利要求书中公布了:1.一种基于深度残差收缩网络的多组学与表型关联预测方法,其特征在于,步骤如下:步骤1数据预处理及深度残差收缩神经网络构建1.1数据预处理:利用基于t检验的差异分析对各个组学数据进行初步的清洗、降维筛选和排序;对于任意组学所有的n个样本的某一特征,分为k种不同表型的数据样本代表样本的表型标签,i的下脚标j为一个变量,表示表型标签具体是第几类,范围为1到k;差异表达分析基于式1计算: 其中,m和l代表样本序号,分别为两样本方差,n为样本总数,为均值,t为统计量;公式1描述了特征差异分析的基本原理,使用双侧测试,按照具体需求取置信度常数α,通过查询t分布表即可得到P值,P值为衡量特征与标签统计学意义上关联程度的一个量,P值越小即认为该特征关联程度更高;根据研究条件进行判断选取P值阈值筛选各组学的所有特征;1.2构建深度残差收缩神经网络:该神经网络输入为1.1中筛选后的各组学特征,输出为表型的初步预测向量;深度残差收缩神经网络由多个结构相同但维度不同的残差收缩块相互堆叠而形成,残差收缩块则基于经典瓶颈残差块改进而来;经典瓶颈残差块的结构由三个卷积块与恒等连接构成,每个卷积块由卷积层、BN层和ReLU层顺序堆叠组成;残差收缩块在经典瓶颈残差块的基础上进行两个改进,第一个改进为在原第三个卷积块与恒等连接之间添加软阈值机制,具体基于式2: 公式2中,阈值为τ,x为第三个卷积块的输出,y为x经过软阈值处理后的输出;其中τ必须同时满足三个条件:根据不同样本自身的噪声情况针对性地取不同值;必须为正数;不能大于输入信号的最大绝对值;为满足这三个条件,采用一个子神经网络分别针对每个样本学习阈值τ;该子神经网络由全局池化层、两个全连接层、ReLU层、BN层和最后的Sigmoid层相互连接组合而成;子神经网络的运行机理如下:输入为x,随后将x绝对值化处理,再进行全局池化以得到一维向量,该一维向量通过两个带激活函数的全连接层及BN层学习一个缩放参数z,该缩放参数经过公式3Sigmoid层进行处理得到尺度参数α: 得到α后,再结合公式4计算出阈值:τ=α·averageii,jj,cc|xii,jj,cc|4公式4中,xii,jj,cc为子神经网络全局池化层的特征映射,三个脚标分别表示特征映射的宽度、高度和通道;子神经网络学习到一个满足三个条件的阈值,从而进一步通过公式2实现软阈值机制,最终使得残差收缩块和整个深度残差收缩神经网络具备针对各个组学特征的抗噪能力;第二个改进为将经典瓶颈残差块的单一恒等连接改进成多个恒等连接;具体的,第一个和第二个卷积块之后分别添加了到残差块输出的恒等连接;按需求堆叠特定数量的不同维度的残差收缩块,并添加全连接、池化、卷积和softmax等特定的处理层即可完整构建深度残差收缩神经网络,该神经网络的最后一层为softmax层,其原理基于式5: 其中fy为上一层的输入,C为分类的类别,该处理满足各分类的预测概率非负且和为1,即各预测表型的预测概率为正且和为一个全集,经过该处理后形成预测向量ypro=c1,c2,…,ck,cl,l∈1,2,...k,为预测分类的类别;将多组学数据被输入至深度残差收缩神经网络进行预测,预测可针对每个样本的各个组学得出初步的预测向量;步骤2置信距离和主观逻辑不确定算法结合的组学融合分析模型首先基于步骤1深度残差收缩神经网络输出的初步预测向量计算置信距离,其次由置信距离进而生成置信分数,随后依据置信分数进行基于主观逻辑不确定算法的多组学融合,最终实现多组学表型-组学关联预测,具体如下:2.1置信距离和置信分数的计算:对每个组学所有样本通过深度残差收缩神经网络进行预测得到多个概率向量,这些向量需通过计算置信距离并生成置信分数;置信距离的计算基于式6: 公式6中ypre代表ypro经one-hot处理后的向量,和分别代表两个向量各自的平均值,Distanceypro,ypre为ypro与ypre两者间的置信距离;将多个组学的置信距离进行加权标准化处理即可得到置信分数s,其直接表征了本发明对各个组学预测结果的信任程度;将置信分数s用以扩充预测概率向量ypre形成mass函数M,为后续主观逻辑不确定关联预测奠定基础;2.2基于主观逻辑不确定证据融合理论的多组学关联预测:利用步骤2.1的初步预测向量ypro和置信分数,实现最终的多组学-表型关联预测;具体输出为最终预测结果向量yres,该向量的置信分数send以及最终预测结果与各个组学的置信距离向量rel;在假设空间中,使用mass函数M表征某个具体样本空间中每种情况出现的概率以及其置信度,各个组学mass函数表示为si为步骤2.1中得到的置信分数,u为组学种类的数量,为第r种组学的初步预测向量;样本的总mass函数Mall由每个组学的mass函数融合而来,如下式: 对式7更具体的表述:对于任意融合后的cq和sq由式8计算,其中q∈1,2,…u: 基于公式7和公式8计算出各个样本的由u种组学融合而来的最终多组学-表型预测向量和其置信分数send;此外,基于公式6对比该融合的预测向量与各单组学初步预测概率向量的置信距离,即由rel可表征各组学与表型的最终预测结果的关联程度,距离小则认为关联程度更高。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。