首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种DNA序列增强子-启动子交互作用识别方法及装置_北京科技大学;北京科技大学顺德创新学院_202311836407.3 

申请/专利权人:北京科技大学;北京科技大学顺德创新学院

申请日:2023-12-28

公开(公告)日:2024-06-18

公开(公告)号:CN117766027B

主分类号:G16B30/00

分类号:G16B30/00;G16B40/00;G06N3/042;G06N3/0499;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2024.04.12#实质审查的生效;2024.03.26#公开

摘要:本发明公开了一种DNA序列增强子‑启动子交互作用识别方法及装置,属于医学工程技术领域。所述方法包括:获取细胞系对应的增强子‑启动子交互作用数据集;将数据集中的DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;利用获取的词嵌入编码构建图结构数据;利用图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;获取待预测DNA序列对并输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据预测的词嵌入编码构建图结构数据;将待预测图结构数据输入训练好的图神经网络模型中,获得DNA序列对中增强子‑启动子交互作用识别结果。采用本发明,可以提高增强子‑启动子交互作用识别准确率。

主权项:1.一种DNA序列增强子-启动子交互作用识别方法,其特征在于,所述方法包括:S1、获取细胞系对应的增强子-启动子交互作用数据集;S2、将所述增强子-启动子交互作用数据集中的DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;S3、根据所述每个DNA序列的词嵌入编码对图结构数据进行构建,获得构建好的图结构数据;其中,S3的根据所述每个DNA序列的词嵌入编码对图结构数据进行构建,获得构建好的图结构数据,包括:S31、将每个DNA序列设定为一个节点,将每个DNA序列的词嵌入编码作为节点特征之一,构建节点特征,获得节点特征集合;S32、将每对DNA序列之间存在增强子-启动子交互作用关系设定为节点边;通过两个DNA序列之间的交互作用数量和活跃启动子数量,计算两节点之间边权重,获得节点边集合;S33、根据节点特征集合与节点边集合,构建成图结构数据;S4、利用所述构建好的图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;S5、获取待预测DNA序列-DNA序列对;S6、将待预测DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据每个待预测DNA序列的词嵌入编码对图结构数据进行构建,获得待预测图结构数据;S7、将所述待预测图结构数据输入所述训练好的图神经网络模型中,获得DNA序列-DNA序列中增强子-启动子交互作用识别结果;其中,S7的将所述待预测图结构数据输入所述训练好的图神经网络模型中,获得DNA序列-DNA序列中增强子-启动子交互作用识别结果,包括:S71、将待预测图结构数据输入训练好的GAT图神经网络中,获得图结构数据中每个节点的特征矩阵;S72、根据每个节点的特征矩阵,获得DNA序列-DNA序列中增强子-启动子交互作用识别结果;其中,DNA序列-DNA序列中增强子-启动子交互作用识别结果表示新的邻接矩阵。

全文数据:

权利要求:

百度查询: 北京科技大学;北京科技大学顺德创新学院 一种DNA序列增强子-启动子交互作用识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术