首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于变异系数法的蛋白质DNA绑定残基预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江工业大学

摘要:一种基于变异系数法的蛋白质DNA绑定残基预测方法,根据待进行DNA绑定残基预测的蛋白质序列S,分别使用PSI‑BLAST和SANN程序生成矩阵PSSM和PSA;分别计算PSSM和PSA每一行的标准差和平均值,得到矩阵F1和F2,并将其串接成特征矩阵F。搭建非对称卷积神经网络,从PDB数据库获取已知DNA绑定残基标签的蛋白质序列作为训练集训练该网络,将S中所有残基的特征向量输入训练好的模型中,根据模型输出的概率值来预测S中残基是否是DNA绑定残基。本发明计算代价低、预测精确性高。

主权项:1.一种基于变异系数法的蛋白质DNA绑定残基预测方法,其特征在于,所述方法包括以下步骤:1输入一个残基数为L的待进行蛋白质DNA绑定残基预测的蛋白质序列,记作S;2对蛋白质序列S,使用PSI-BLAST程序生成一个大小为L×20蛋白质位置特异性评分矩阵,记作PSSM;3对蛋白质序列S,使用SANN程序生成一个大小为L×3的溶剂可及性特征矩阵,记作PSA;4分别计算PSSM和PSA中每一行的标准差,获取两个大小均为L×1的向量,记作M1和M2;5分别计算PSSM和PSA中每一行的平均值,获取两个大小均为L×1的向量,记作M3和M4;6通过以下公式,获取两个大小为L×1的变异系数向量,记作V和U,V和U中第i个元素分别表示为: 其中,和分别表示M1,M2,M3和M4中的第i个元素;7通过以下公式,分别获取对应于PSSM和PSA的两个大小为1×L的权重向量W1和W2,W1和W2中第i个元素分别表示为: 其中,Vi和Ui分别表示V和U中第i个元素;8通过以下公式,获取一个大小为L×20的特征矩阵,记作F1,F1中第i行第j列元素表示为: 其中,PSSMij表示PSSM中第i行第j列元素;9通过以下公式,获取一个大小为L×3的特征矩阵,记作F2,F2中第i行第k列元素表示为: 其中,PSAik表示PSA中第i行第k列元素;10将步骤8和9中获取的F1和F2串接为一个大小为L×23的特征矩阵,记作F;11矩阵F中任意一行Fi,i=1,2,...,L,表示蛋白质序列S中第i个残基的特征向量;12从PDB数据库中获取已知DNA绑定残基状态的蛋白质序列作为训练蛋白质集合,对每一个训练蛋白质序列,使用步骤2-11生成每个残基样本,构成训练样本集;13搭建非对称卷积神经网络预测蛋白质序列S的DNA绑定残基,该网络共有三层,前两层为非对称卷积层,最后一层是全连接层,每一层输出作为下一层的输入,使用sigmoid激活函数使网络的输出值在0,1范围内;14使用步骤12中构建的训练样本集和二分类交叉熵损失函数训练步骤13中搭建的网络,获取预测模型;15将蛋白质序列S中残基的特征向量输入到步骤14获取的预测模型中,当模型输出概率大于判定阈值threshold,判断对应残基为DNA绑定残基。

全文数据:

权利要求:

百度查询: 浙江工业大学 一种基于变异系数法的蛋白质DNA绑定残基预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。