首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于向量化的参考反应查询方法和系统_上海药明康德新药开发有限公司_202211441411.5 

申请/专利权人:上海药明康德新药开发有限公司

申请日:2022-11-17

公开(公告)日:2024-06-21

公开(公告)号:CN116226472B

主分类号:G06F16/903

分类号:G06F16/903;G06F18/213

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2023.06.23#实质审查的生效;2023.06.06#公开

摘要:本发明公开了一种基于向量化的参考反应查询方法和系统。该查询方法,包括以下步骤:根据每个反应对应一个总向量,通过聚类算法将数据库中的若干反应划分为若干簇类,得到每个簇类的聚类中心的总向量;计算query查询反应与每个簇类的聚类中心两两之间的相似度,得到与query反应相似度最大的聚类中心;计算query反应与相似度最大的聚类中心所在簇类的所有反应两两之间的相似度,得到与query反应最相似的N个反应,N>0;总向量包含AI指纹、反应传统指纹和产物分子传统指纹;S加权=w1×SAI+w2×S反应+w3×S产物w1+w2+w3。本发明同时具有较强的可解释性和准确性。

主权项:1.一种基于向量化的参考反应查询方法,其特征在于,包括以下步骤:根据每个反应对应一个总向量,通过聚类算法将数据库中的若干反应划分为若干簇类,得到每个簇类的聚类中心的总向量;计算query反应与每个所述簇类的聚类中心两两之间的相似度,得到与所述query反应相似度最大的聚类中心;计算query反应与所述相似度最大的聚类中心所在簇类的所有反应两两之间的相似度,得到与所述query反应最相似的N个反应,N>0;所述总向量包含AI指纹、反应传统指纹和产物分子传统指纹;S加权=w1×SAI+w2×S反应+w3×S产物w1+w2+w3;S加权表示两个反应之间的相似度;SAI表示两个反应之间的AI指纹相似度,由对应的两个AI指纹之间通过余弦距离计算获得;S反应表示两个反应之间的反应传统指纹相似度,由对应的两个反应传统指纹之间通过Jaccard距离计算获得;S产物表示两个反应之间的产物分子传统指纹相似度,由对应的两个产物分子传统指纹之间通过Jaccard距离计算获得;w1、w2和w3分别表示AI指纹的权重、反应传统指纹的权重和产物分子传统指纹的权重,w1:w2:w3=1~10:1~10:1;所述AI指纹为通过深度神经网络中的Bert模型生成的向量;通过百万级到千万级的反应数据SMILES表达式训练Bert模型;所述反应传统指纹为通过枚举反应物和产物分子的官能团、反应中心获得的相应的0-1编码;所述产物分子传统指纹为通过枚举产物分子的官能团获得的相应的0-1编码。

全文数据:

权利要求:

百度查询: 上海药明康德新药开发有限公司 一种基于向量化的参考反应查询方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。