买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:星药科技(北京)有限公司
摘要:一种基于子图‑变分自编码结构的分子生成方法,首先挖掘训练集中所有分子的频繁子图集,再通过基于统计的计数阈值与药学性质筛选频繁子图,得到满足条件的分子子图总集S*;对训练集中的每个分子G进行图分解,得到相应的分子子图集合S;将分子集S输入编码器进行编码,得到相应的隐空间向量Z;最后将Z输入解码器进行解码,得到重构的分子G′,本发明克服了传统逐原子生成方法带来的化学特性缺失和难以合成等缺点,通过子结构的应用保证了分子的某些化学性质,进而生成化学性质稳定并且易于合成的分子结构,为新型药物小分子的发现与设计带来极大的便利,降低了相关工作人员对领域知识的依赖,提高了新型药物设计和开发的效率,缩短研发周。
主权项:1.基于子图-变分自编码结构的分子生成方法,其特征在于:步骤一,挖掘训练集中所有分子的频繁子图集,再通过基于统计的计数阈值与药学性质筛选频繁子图,得到满足条件的分子子图总集S*;其中,生成子图总集S*方法:1设置频繁度k,利用gSpan算法将训练集中的分子生成频繁子图集;2用随机森林算法训练特定化学药性检测器Ri;3筛选频繁子图集:用上述检测器Ri检测1所得频繁子图集,筛选大于一定阈值的频繁子集作为分子子图总集S*;步骤二,对训练集中的每个分子G进行图分解,得到相应的分子子图集合S;所述分子子图集合S生成方法:1利用化学工具包自带的相关函数找到分子中的环;2基于分子子图总集S*,根据子图大小,按照后项搜索匹配原则,从较大的子图开始依次分割原分子,得到所有的化学性质稳定的最小单元的集合S;步骤三,将分子集S输入变分自编码器进行编码,得到相应的隐空间向量Z;所述的变分自编码器,其训练方法如下:ⅰ原子层分子图:u,v表示原子,{eau},{ebuv}分别表示所有以原子为顶点的集合与以原子与原子相连为边的集合; ⅱ子图层分子图:Si表示第i个子图,表示第i个子图Si代表的顶点,dij表示Si到Sj的连接; ⅲ隐变量: iv预测下一个添加的子图St: v预测St添加到Sk的方式:pM=softmaxhM·zG Mtk={uj,vj||uj∈Sk,vj∈St}其中ⅰ-ⅲ为编码过程,iv-v为解码过程,损失函数为 其中,Qz|G是均值、方差与G相似的正态分布,PG|z表示隐变量解码时的损失;在解码过程v中原分子重建时有原始分子图;步骤四,将Z输入变分自解码器进行解码,得到重构的分子G′。
全文数据:
权利要求:
百度查询: 星药科技(北京)有限公司 基于子图-变分自编码结构的分子生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。