首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于交互式推理网络的piRNA与mRNA靶标对的预测方法_西安理工大学_202310955332.4 

申请/专利权人:西安理工大学

申请日:2023-08-01

公开(公告)日:2024-04-09

公开(公告)号:CN116994645B

主分类号:G16B15/30

分类号:G16B15/30;G06F18/241;G06F18/214;G06N20/20;G06N5/04;G06F18/25;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.11.21#实质审查的生效;2023.11.03#公开

摘要:本发明提供了一种基于交互式推理网络的piRNA与mRNA靶标对的预测方法,步骤S1:构建小鼠piRNA与mRNA靶标对预测研究的基准数据集;步骤S2:构建piRNA与mRNA靶标对预测研究的可靠负集;步骤S3:对前序步骤得到的序列对进行预处理操作;步骤S4:构建用于预测的交互式推理网络模型;步骤S5:对该发明所涉及模型中的超参数进行优化,具体参数包含学习率、批次大小、优化器、epoch等,以寻求最优的超参数组合;步骤S6:实现piRNA与mRNA靶标对的二分类判定。本发明可用于鉴定小鼠中piRNA与mRNA靶标对,基于正未学习构建可靠的负样本集、交互式推理网络有效编码和特征提取等处理步骤使得预测结果具有较高的准确率和可靠性。

主权项:1.基于交互式推理网络的piRNA与mRNA靶标对的预测方法,其特征在于,包括以下步骤:步骤S1,构建小鼠piRNA与mRNA靶标对预测研究的基准数据集;步骤S2,构建piRNA与mRNA靶标对预测研究的可靠负集;步骤S3,对前序步骤得到的序列对进行预处理操作;步骤S4,构建用于预测的交互式推理网络模型;步骤S5,对模型中的超参数进行优化;步骤S6,实现piRNA与mRNA靶标对的二分类判定;其中,步骤S3包括:S31:在原始RNA序列输入到模型之前,采用独热编码将序列编码为数值向量作为模型的输入;在piRNA与mRNA靶标对中,piRNA和mRNA的长度分别被固定为35nt和21nt,所述nt为nucleotide核苷酸;依据互补DNA的形式,基因序列由“A”、“G”、“C”、“T”和“N”组成;其中,“T”对应于RNA中的“U”,“N”表示不确定;S32:当序列长度不足35nt或21nt时,使用字母“N”填充缺失的部分;S33:确定不同碱基和字母“N”的编码形式;S34:基于二进制表示方法对piRNA与mRNA靶标对的标签做编码处理;其中,步骤S4包括:S41:交互式推理网络模型设置输入层,编码层,交互层,特征提取层和输出层;S42:在步骤S33和S34中,将piRNA和mRNA序列对进行独热编码形成的离散式向量表示,作为模型的输入;S43:在编码层中,通过两层神经网络结构,自注意力层和语义融合操作可实现对独热向量的编码和特征融合,获取更加丰富的序列信息;S44:在交互层中,将上层得到的piRNA编码表示和mRNA编码表示采用逐元素乘法进行信息交互,用于提取序列之间的相关性;S45:特征提取层是由FirstScaleDown、DenseNet网络和展平操作三部分组成;S46:输出层包括DecayingDropout丢失层和Dense全连接层两部分组成,在丢失层中通过调整参数减轻过拟合的问题,在全连接层使用softmax对特征表示归一化操作,得到每一个样本对应类别的预测概率;其中,特征提取层采用CNN模型DenseNet网络实现,将交互层的输出向量I作为特征提取层的输入,其中I的维度为35,21,4;FirstScaleDown层用来缩小数据的通道数,提取更具有代表性的特征;DenseNet通过特征在通道上的连接实现特征重用;展平操作用于实现数据维度变换;S451:在FirstScaleDown层中使用一个1×1的卷积核和缩小比例0.3来缩小数据的维度;经过计算现有4层通道被缩减为1层,其中输出该层张量维度为35,21,1;S452:将缩小后的张量传入到DenseNet中,其中DenseNet是由三层完全相同结构组成,其中每层有一对密集块和过渡块,实现特征在通道上的重用,具体包括以下步骤,S4521:在每一层的密集块设置8个3×3的卷积层,每个卷积层的通道数设置为20,用于实现特征重用;在每一层的过渡块中包括Conv2D和MaxPooling2D两个操作,Conv2D用于缩小前一个密集块输出张量的通道数,缩小比例compression为0.5,MaxPooling2D用于降低张量的空间维度和减少参数,窗口每次滑动的距离stride被设置为2,2;S4522:经过第一层密集块中8个卷积层处理后,得到的张量维度为35,21,160,再传入到过渡块后得到的张量维度为17,10,80;S4523:依次类推,在第二层中密集块处理得到的张量维度为17,10,240,过渡块处理后张量维度为8,5,120,第三层中密集块和过渡块的处理后张量形状分别为8,5,280和4,2,140;S453:对第三层过渡块输出的张量进行展平操作,将三维数据转换为全连接层所需的一维向量,维度为1120。

全文数据:

权利要求:

百度查询: 西安理工大学 基于交互式推理网络的piRNA与mRNA靶标对的预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。