首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种miRNA和药物耐药性关联的高效预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中南林业科技大学

摘要:本发明公开一种miRNA和药物耐药性关联的高效预测方法,主要包括以下步骤:1、下载数据集,得到miRNA、药物的列表,和关联矩阵A;计算miRNA和药物的高斯相互作用属性核相似矩阵GSM、GSD;2、计算miRNA之间的序列相似性矩阵SSM,计算药物之间的化学结构相似性ESD;3、利用GSM和SSM构建miRNA的相似矩阵SM;且利用GSD和ESD构建药物的相似矩阵SD;4、融合A、SM和SD构建一个全局异构网络G;利用倾斜重启随机游走计算扩散特征,并使用奇异值分解降维;5、计算miRNA‑药物对的Hetesim得分;6、结合扩散特征和HeteSim得分得到特征数据集,训练支持向量机分类器去预测miRNA‑药物的关联关系;7、使用10折交叉验证方法进行验证;应用本发明预测miRNA和药物耐药性关联关系的精度高。

主权项:1.一种miRNA和药物耐药性关联的高效预测方法,其特征在于,包括以下步骤:步骤1:从公开数据库ncDR下载miRNA-药物耐药性关联数据集,进行去重处理,得到miRNA的列表和药物的列表,并且得到miRNA-药物耐药性关联的矩阵A;然后分别计算出miRNA的高斯相互作用属性核相似矩阵GSM和药物的高斯相互作用属性核相似矩阵GSD;步骤2:从miRBase数据库下载miRNA列表的序列,计算miRNA之间的序列相似性矩阵SSM;用公开的SimComp工具计算药物之间的化学结构相似性矩阵ESD;步骤3:利用miRNA之间的序列相似性矩阵SSM、miRNA的高斯相互作用属性核相似矩阵GSM,构建miRNA的相似矩阵SM;利用药物之间的化学结构相似性矩阵ESD、药物的高斯相互作用属性核相似矩阵GSD,构建药物相似矩阵SD;步骤4:融合miRNA-药物耐药性关联网络的关联矩阵A、miRNA的相似矩阵SM和药物的相似矩阵SD三个子网,构建一个全局异构网络;在异构网络上,利用倾斜重启随机游走算法得到扩散特征;使用奇异值分解SVD对扩散特征进行降维;步骤5:计算异构网络上miRNA-药物对的Hetesim得分;步骤6:结合扩散特征和HeteSim得分得到特征数据集,将得到的特征数据用于支持向量机SVM分类器,该分类器用于预测miRNA-药物的耐药性关联;步骤7:使用10折交叉验证进行验证;步骤1中计算miRNA-药物耐药性关联网络的矩阵A,miRNA的高斯相互作用属性核相似矩阵GSM和药物的高斯相互作用属性核相似矩阵GSD的步骤如下:下载公开数据库ncDR中已知的miRNA-药物的耐药性关联关系,进行去重处理,得到miRNA的列表和药物的列表,并且得到miRNA-药物的耐药性关联网络的矩阵A;A的行数为miRNA的数量,A的列数为药物的数量,Ami,dj如式1所示: 其中Ami,dj=1,表示miRNAmi和药物dj存在关联关系,值为0表示不存在关联关系;构建miRNA的高斯相互作用属性核相似矩阵GSM;对于一个miRNAmi,它的IPmi值定义为miRNA-药物的耐药性关系的关联矩阵A的第i行,计算每一对miRNAmi和miRNAmj之间的高斯相互作用属性核相似性,如式2所示:GSMmi,mj=exp-γm||IPmi-IPmj||22 其中,GSM表示miRNA的高斯相互作用属性核相似矩阵,元素GSMmi,mj表示miRNAmi和miRNAmj的高斯相互作用属性核相似性,γm用于控制高斯相互作用属性核相似性的频宽,它表示基于新的频宽参数γ′m的正规化的高斯相互作用属性核相似性频宽;nm表示miRNA的数量;同样,基于功能相似的miRNA与相似的药物之间具有关联关系的假设,利用已知的miRNA-药物耐药性关联关系网络,构建药物的高斯相互作用属性核相似矩阵GSD,对于一个药物di,它的IP′di值定义为miRNA-药物耐药性关系的关联矩阵A的第i列,计算每一对药物di和药物dj之间的高斯相互作用属性核相似性,如式4所示:GSDdi,dj=exp-γd||IP′di-IP′dj||24 其中,GSD表示药物的高斯相互作用属性核相似矩阵,元素GSDdi,dj表示药物di和药物dj的高斯相互作用属性核相似性,γd表示基于频宽参数γ′d的正规化的高斯相互作用核相似性频宽,nd表示药物的数量;步骤2中利用公开数据库miRBase下载相关miRNA的序列,计算miRNA之间的序列相似度SSMmi,mj,如式6所示: 0≤Levenshteinmi,mj≤lenmi+lenmj7其中lenmi表示miRNAmi序列的长度,lenmj表示mj序列的长度,Levenshteinmi,mj指由mi的序列转化为mj序列的类编辑距离,即需要的最少操作次数,其中插入的操作次数是1、删除的操作次数是1和替换的操作次数是2;利用公开的SimComp工具计算药物之间的化学结构相似性矩阵ESD;以数据库ncDR中的药物对应的KEGG数据库入口编号作为参数,使用SimComp工具计算这些药物之间的化学结构相似分数;通过调用SimComp的API计算每一对药物di和药物dj的化学结构相似分数ESDdi,dj;步骤3中利用miRNA之间的序列相似性矩阵SSM、miRNA的高斯相互作用属性核相似矩阵GSM,构建miRNA的相似矩阵SM;利用药物之间的化学结构相似性矩阵ESD、药物的高斯相互作用属性核相似矩阵GSD,构建药物的相似矩阵SD,步骤如下:利用步骤1和步骤2得到的miRNA之间的高斯相互作用属性核相似矩阵GSM、序列相似矩阵SSM,构建miRNA的相似矩阵SM,SM是nm*nm维,SMmi,mj如式8所示: 利用步骤1和步骤2得到的药物之间的高斯相互作用属性核相似矩阵GSD、化学结构相似矩阵ESD,构建药物的相似矩阵SD,SD是nd*nd维,SDdi,dj如式9所示: 步骤4中融合miRNA-药物耐药性关联网络的关联矩阵A、miRNA的相似矩阵SM和药物的相似矩阵SD三个子网,构建一个全局异构网络;利用异构网络得到miRNA权值矩阵和药物权值矩阵,构建游走网络;在漫游网络上进行重启随机游走算法计算扩散分数,得到高维扩散特征;再使用奇异值分解SVD进行降维,得到低维扩散特征;具体子步骤为:1构建异构网络融合了miRNA-药物耐药性关联网络的关联矩阵A、miRNA的相似矩阵SM和药物的相似矩阵SD三个子网,构成全局异构网络的邻接矩阵G,G中共nm+nd维,nm表示miRNA的数量,nd表示药物的数量;G如式10所示: 其中AT表示A的转置;2构造权值矩阵将与同一个miRNA相关的多个药物看为一个药物组,如果其他与这个miRNA相似度高的miRNA和该药物组中的一个药物存在关联,则认为这个miRNA和药物组内的其他药物存在潜在的关联;对于药物di和miRNAmj,将与di相关的多个miRNA看成一个miRNA组,如果这个组里面的miRNAmk和miRNAmj相似度高,则假设di和mj之间可能存在关联;基于上述假设,我们得到nd*nm维的miRNA权值矩阵WMM,如式11所示: 其中表示与药物di相关的miRNA组,{ifAmk,di==1,1≤k≤nm}表示miRNAmk与药物di有关联关系,SMmk,mj是miRNAmk和miRNAmj之间的相似性;同样可以得到nm*nd药物权值矩阵WDD,如式13: 其中表示与miRNAmj相关的药物组,{ifAmj,dz==1,1≤z≤nd}表示miRNAmj与药物dz有关联关系,SDdz,di是药物dz和药物di之间的相似性;3构建游走网络当药物dx作为游走者时,在miRNA节点网络上进行游走;TD是游走网络的转移概率矩阵,对于任何给定的miRNAmi和mj,TDmi,mj代表在dx的游走过程中,全局网络中mi转移至mj的概率,如式15所示: 其中mi是游走的当前节点,mj是下一个节点,如果mj和dx在权值矩阵中的值不为0,意味着mj和dx有潜在关联,也就是WDDmj,dx0时,STDmi,mj=WDDmj,dx,否则mi转移至mj的概率就跟miRNA相似矩阵有关,STDmi,mj=SMmi,mj;当miRNAmy作为游走者时,在药物节点网络上进行游走;TM是游走网络的转移概率矩阵,对于任何给定的药物di和dj,TM代表my在游走过程中,全局网络中di转移至dj的概率,如式17所示, 其中di是游走的当前节点,dj是下一个节点,如果dj和my在权值矩阵中的值不为0,意味着dj和my有潜在关联,也就是WDDdj,my0时,STMdi,dj=WMMdj,my,否则di转移至dj的概率就跟疾病相似矩阵有关,STMdi,dj=SDdi,dj;4在游走网络上进行游走,得到每个节点的扩散特征基于子步骤3中得到转移概率矩阵TD、TM,采用随机游走可得到药物节点的扩散特征PD=[P1,P2,P3,...,Px,...,Pnd],其中Px表示节点dx的nm*1维扩散特征;同时得到miRNA节点的扩散特征PM=[P1,P2,P3,...,Py,...,Pnm],其中Py表示节点my的nd*1维扩散特征,nm表示miRNA节点的个数,nd表示药物节点的个数;当计算药物节点dx的扩散特征Px时,每一步游走都面临两个选择,随机选择相邻的miRNA节点或者返回开始出发的节点;游走的过程如式19所示: 其中r是重启概率,是节点dx的一个nm维的迁移概率向量,它的第k个元素表示第t步访问节点k的概率,k∈{1,2,...,nm};代表节点dx的初始迁移概率向量,代表dx访问节点mi的初始迁移概率;当计算miRNA节点my的扩散特征Py时,游走的过程如式21所示: 其中r是重启概率,是节点my的一个nd维的迁移概率向量,它的第k个元素表示第t步访问节点k的概率,k∈{1,2,...,nd};代表节点my的初始迁移概率向量,代表my访问节点dj的初始迁移概率;经过多次迭代之后,所有Px,Py的两次迭代值的差小于10-10,miRNA扩散特征PM,药物扩散特征PD达到稳定状态,得到最终的扩散特征;5计算低维扩散特征;当节点数量变得更多时,扩散状态是高维的;我们使用奇异值分解SVD来降低扩散特征维数;高维扩散特征矩阵P被分解成如式23和24所示:P=U∑VT23P=U∑12∑12VT24其中U和V分别表示P的左奇异矩阵和右奇异矩阵U和V均为单位正交阵,∑仅在对角线上有值,其它元素均为0,我们称这些非0值为P的奇异值,并且在∑中这些值按从大到小的顺序排列;奇异值可以被看作成一个矩阵的代表值,或者说,奇异值能够代表这个矩阵的信息;当奇异值越大时,它代表的信息越多;因此,为了减少计算量,我们只需要取前d个最大的奇异值,就能够还原出数据本身;所以我们取前d个奇异值和特征向量,即25和26所示:X=Un*d∑d*d1225W=∑d*d12Vd*nT26对PD、PM分别进行奇异值分解得到低维节点特征矩阵XD、XM,矩阵XD的维数是nd*d,其中每一行是每个药物节点的低维扩散特征向量;矩阵XM的维数是nm*d,其中每一行是每个miRNA节点的低维扩散特征向量;由此,我们就得到了降维后同维度的药物和miRNA扩散特征;步骤5中计算Hetesim得分,HeteSim评分是用来估计一对节点的相关性的一种度量;我们计算了从miRNA到药物的路径;在长度小于m的约束下,从miRNA到药物共有t条不同的路径;因此,我们得到了t维HeteSim得分,步骤如下:计算异构网络上miRNA-药物对的Hetesim得分;HeteSim评分是用来估计一对节点的相关性的一种度量,它的值取决于该对节点经过的路径;我们计算从miRNA到药物的异构网络的路径,在长度小于m的约束下,从miRNA到药物共有t条不同的路径;对miRNA到药物的t条路径,计算miRNA和药物之间HeteSim评分的子步骤如下:1分别计算全局异构网络中从miRNA到药物、miRNA到miRNA、药物到miRNA、药物到药物的转移概率矩阵MMD,转移概率矩阵中MMDi,j的计算公式如27所示: 其中M和D表示全局异构网络中两种类型的对象miRNA和药物,i和j表示全局异构网络中的两个节点,矩阵I是M和D的关联矩阵;如果M和D都是药物,则矩阵I为关联矩阵SD;如果M和D都是miRNA,则矩阵I为关联矩阵SM;如果M和D分别是miRNA和药物,则矩阵I为关联矩阵A;可得到4种转移的概率矩阵分别为MMD、MMM、MDM和MDD;2path=h1,h2,…hm+1表示路径长度为m的路径,将路径分为两个部分,当路径长度m为偶数时,将路径分为pathL=h1,h2,…hmid和pathR=hmid,h2,…hm+1,否则当path的长度m为奇数时,路径不能被分为两个相等长度的路径;为了处理这类问题,我们需要分别取和两种情况,然后,我们可以得到分别取这两个mid时的不同HeteSim分数,最终的分数为这两个HeteSim分数的平均值;3计算路径pathL和pathR可达概率矩阵和其中可达概率矩阵和的定义为28和29所示: 4计算路径path的HeteSim得分如30所示: 是PathR的反向路径;针对关联关系矩阵A中miRNA和药物的关系,我们得到了异构网络中每一对miRNA和药物的t维HeteSim得分;步骤6中结合d维扩散特征和t维HeteSim得分得到2*d+t维的特征数据集,将得到的特征数据用于支持向量机SVM分类器,该分类器用于预测miRNA-药物的耐药性关联,步骤如下:结合扩散特征和HeteSim得分得到特征数据;对于计算得到的Hetesim得分矩阵中对应每一对药物和miRNA样本,根据样本对应的药物和miRNA分别得到对应的d维扩散特征,则得到2*d+t维特征,针对样本药物di和miRNAmj,则将对应的t维HeteSim得分与对应药物di的d维扩散特征、miRNAmj的低维扩散特征,即扩散特征矩阵XD的第i行,XM的第j行结合起来,得到药物di和miRNAmj的2*d+t维特征;采用类似的方法得到所有样本的2*d+t维的特征数据,将得到的特征数据用于支持向量机SVM分类器,再将SVM分类器用于预测miRNA-药物的耐药性关系;步骤7中使用10折交叉验证进行验证;训练集随机分为10组大小相同的子集;每个子集依次用作验证测试数据,其余9个子集用作训练数据;交叉验证过程重复10次,并使用10次的平均性能度量进行性能评估;我们使用多种指标来评估性能,包括准确度ACC、召回RECALL、F1-scoreFSC、MCCMatthewscorrelationcoefficient和ROC曲线下与坐标轴围成的面积AUC。

全文数据:

权利要求:

百度查询: 中南林业科技大学 一种miRNA和药物耐药性关联的高效预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。