首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种识别生物必需蛋白质方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:贵州大学;重庆电子工程职业学院

摘要:本发明提出了一种利用深度神经网络构建多维生物属性信息与PPI拓扑特性之间必需蛋白识别的方法,针对基因表达数据不全面问题,对缺席数据进行补充,以提高鲁棒性。再分别采用构建PPI网络拓扑结构、皮尔逊相关系数、同源相关系数来减少深度神经网络的收敛速度。最后通过深度神经网络寻找节点的度、皮尔逊相关系数、同源相关系数三个特征的最佳关联关系,从而提高必须蛋白质的识别精度。

主权项:1.一种识别生物必需蛋白质方法,包括以下步骤,S1数据下载;S2缺席数据补充;S3构建PPI网络拓扑结构、皮尔逊相关系数、同源相关系数;S4对深度神经网络进行训练;所述步骤S1包括,从数据集获得酵母蛋白信息并剔除自相互作用和重复相互作用;从数据库中下载同源蛋白的信息,从数据集下载酵母的基因表达数据;从数据库中下载包含酿酒酵母必需基因的数据集作为基准集;所述步骤S2包括,对于给定的基因u,其在不同时刻的基因表达通过载体表达Expu={Expu,1,Expu,2,…,其中Expu,i为基因u在i时刻的平均表达水平,基因u的蛋白质的度的信息dμ和起源信息Ort为gθu; 其中,gθu=[duOrtu],让为基因u对应的蛋白质的实际值,其中θi表示基因u在第i时刻的值,当取最小值,线性拟合度最高,即回归模型刚好在基因表达的边界上;用: 让同时,对θ求导,得到: 得: 缺席数据表示为: 其中Nμ,σ2表示高斯扰动;所述步骤S3包括,S31计算PPI节点的度,在PPI网络中,设V代表PPI网络的节点集,E代表PPI网络的边缘集,得到基于PPI网络的无向图G=V,E,设图G=V,E,μ∈VG,ν∈VG,eμ,ν∈EG,节点μ的度dμ是 其中Γμ表示该节点μ的邻居节点集,euv表示该节点u与节点v的边,Num表示数量函数,归一化,节点的强度Sdu为, S32计算基因表达的相关性对于基因u和v,它们之间的PCC计算如下: 其中为基因u在各时刻的平均表达量,为基因ν在各时刻的平均表达量,σu为基因u在各时刻表达量的标准方差,σν为基因v在各时刻表达量的标准方差,cov表示相关性函数,T表示基因u的总时刻,t表示基因u的具体时刻,若PCCu,v为正值,则基因u与v正相关,如果PCCu,v值为负,则基因u和v呈负相关,表示基因u的平均表达量,表示基因v的平均表达量,计算出基因u在所有节点中的平均基因强度Genu, GenV表示基因v在所有节点中的平均基因强度,n表示节点的数量;S33计算同源相关性基因本体定义的语义相似性旨在提供不同生物过程、分子功能或细胞成分之间的功能关系,搜索连接两个词或注解的最短路径,并利用最短路径上的权值之和计算语义相似度来度量GO上的语义相似度,μ与ν之间的距离为 τ是他们最低端的共同祖先,root是它们最古老的祖先,dis表示距离函数,计算出节点u在所有节点中的平均同源强度Ortu, Ortv表示节点v的同源强度;所述步骤S4包括,令X表示经过处理后的蛋白质数据,Y是必须蛋白质数据,给定训练集D={X,Y},x∈X,y∈Y,从而可得: 其中f是激活函数,ω为权重,θ为阈值,训练集D每个数据输入为3个属性描述,x=[Sd,Gen,Org]T,输出为2维实值向量y=[0101],定义隐含层的层数为L,每个隐含层的节点数为h,令y'为y的预测值,可得:输入层到隐含层的第1层的第J个节点L1,j的预测值y'1j是 其中θj表示隐含层的第1层的第J个节点的阈值,h表示隐含层的节点的个数,ωi,j表示第i节点和第j节点之间的权重,ωi,j,1表示隐含层第1层第i节点和第j节点之间的权重隐含层c到隐含层d的第J个节点Ld,j的预测值y'd,j是 隐含层到输出层的第J个节点预测值Y'j是 y’L,i表示隐含层第L层到第i个节点的预测值,采用均方误差作为损失函数Mse, 其中size为数据集D的训练数据的长度,令Δω为权值的更新形式,ω←ω+Δω给定学习率η,以目标的负梯度方向对参数进行调整,存在下式 y表示实际值,y’表示预测值,y’L表示隐含层第L层预测值,得到得隐含层数L,隐含层节点数h,阈值θ。

全文数据:

权利要求:

百度查询: 贵州大学 重庆电子工程职业学院 一种识别生物必需蛋白质方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。