买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州城市学院
摘要:本发明涉及生物数据分析技术领域,尤其是指一种氨基酸变异致病性预测方法、系统及设备。将序列信息输入保守性信息编码模型,对待测氨基酸保守性信息进行提取,得到多序列对比信息,通过双边交联循环神经网络,提取编码后的序列信息的序列特征与多序列对比信息的多序列对比特征,获取待测氨基酸的初始变异信息,利用AAIndex数据库分别得到变异前待测氨基酸性质相关指数与变异后待测氨基酸性质相关指数,并且映射到一个向量空间,作为变异信息,提取变异信息的变异特征,利用多序列对比特征、序列特征与变异特征,得到氨基酸变异致病性预测结果,提高了多种生物信息的质量,使氨基酸变异致病性预测更加精准。
主权项:1.一种氨基酸变异致病性预测方法,其特征在于,包括以下步骤:获取待测氨基酸所在蛋白质的FASTA序列,作为蛋白质序列信息,对蛋白质序列信息进行校验,将校验后的蛋白质序列信息作为序列信息;将序列信息输入保守性信息编码模型,对待测氨基酸保守性信息进行提取,得到多序列对比信息,包括:以序列信息作为查询目标,获取在预设数据库中与查询目标对应的多个同源序列,将查询目标对应的多个同源序列排列对齐,得到多序列对比数据;基于多序列对比数据中各个氨基酸序列所处位点,分别将处于同一位点的氨基酸序列分为一组,将各组氨基酸序列通过pytorch嵌入模块进行嵌入并增加预设维度,再分别进行氨基酸编码,得到多组编码氨基酸;将每组编码氨基酸分别输入三个独立的线性层,得到每组编码氨基酸对应的查询向量、键向量和值向量;将每组编码氨基酸对应的查询向量、键向量和值向量通过多头自注意力机制,得到每组编码氨基酸对应的注意力向量;将多组编码氨基酸对应的注意力向量拼接为一个一维向量;一维向量通过第一多层感知机,得到多序列对比信息;对序列信息进行氨基酸编码,得到编码后的序列信息;将编码后的序列信息与多序列对比信息分别输入双边交联循环神经网络,提取编码后的序列信息的序列特征与多序列对比信息的多序列对比特征;获取待测氨基酸的初始变异信息,其中初始变异信息包括:变异前待测氨基酸序列、变异位点以及变异后待测氨基酸序列;基于变异前待测氨基酸序列与变异后待测氨基酸序列,利用AAIndex数据库分别得到变异前待测氨基酸性质相关指数与变异后待测氨基酸性质相关指数,将变异前待测氨基酸性质相关指数与变异后待测氨基酸性质相关指数映射到一个向量空间,作为变异信息,提取变异信息的变异特征;将多序列对比特征、序列特征与变异特征拼合后,输入第二多层感知机,输出氨基酸变异致病性预测结果。
全文数据:
权利要求:
百度查询: 苏州城市学院 一种氨基酸变异致病性预测方法、系统及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。