首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于序列同源性的特定生物序列预测方法及其系统 

申请/专利权人:电子科技大学长三角研究院(衢州)

申请日:2024-03-21

公开(公告)日:2024-06-25

公开(公告)号:CN117953973B

主分类号:G16B30/10

分类号:G16B30/10;G16B40/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。

主权项:1.一种基于序列同源性的特定生物序列预测方法,其特征在于,该方法包括:准备特定生物序列相关的原始序列数据集;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据所述的特征向量输出预测结果;使用所述的原始序列数据集训练所述的深度模糊回声状态网络;所述的基于序列同源性评分的模糊隶属函数构造方法为:输入原始序列数据集,定义模糊规则的数量为;对于序列,通过史密斯-沃特曼算法进行双序列比对以计算同源性分数;计算每个序列与其他所有序列的同源性分数之和,对其进行排序,取值最大的前个序列样本作为支持序列;对于个模糊集,每个模糊集包含一个支持序列;对于第个输入序列,第个模糊集隶属值为: 其中是个模糊集的最大同源性对齐分数;是用于调整函数输出的常数,介于0和1之间;对于每个序列,通过上式计算得到;所述深度模糊回声状态网络的构造方法为:基于以下定义随机初始化和:假设DFESN有个储层,记录了时刻的输入信号、内部回声状态信号以及输出信号;其中第个储层中的神经元数量为; 表示固定的随机输入权值; 为第个储层随机固定的内部权值;样本序列在第个储层的状态转变为: 其中是第个储层在时刻的输入信号;每个都被初始化为空状态();逐层处理后,结合各层回波状态变量,得到时刻的采集状态: 式中为水平连接;是序列同源性分数隶属函数的输出;深度模糊回声状态网络的输出定义为: 其中,并且为标量;训练过程中,利用最大化混合相关熵测量模型输出层期望值与实测值之间的关系,具体包括:使用最大化混合相关熵确定具有高鲁棒性的最佳模型: 其中为混合系数矢量; 为带宽矢量; 为中心向量; 为核函数,为第个样本误差;N为样本数量,M为基于熵的损失函数的数量;求解下列目标函数的最大值: 其中,代表正则化参数;令,得到: 其中为每个样本的真实类别,,,为单位矩阵;对角矩阵Ξ计算公式如下: 向量计算公式如下: ;基于二次信息势和概率密度函数之间的欧氏距离确定模型的最优参数,具体包括:通过计算和利用二次信息势及概率密度函数之间的欧氏距离更新参数;计算和;通过更新,判断是否迭代到最大值,若是则进入下一步,否则重新进入第一步不断迭代;通过计算得到输入序列的预测结果。

全文数据:

权利要求:

百度查询: 电子科技大学长三角研究院(衢州) 基于序列同源性的特定生物序列预测方法及其系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术