【发明公布】蛋白质设计方法、装置、设备和介质_北京百度网讯科技有限公司_202410324573.3

导航：龙图腾网> 最新专利技术> 蛋白质设计方法、装置、设备和介质_北京百度网讯科技有限公司_202410324573.3

申请/专利权人：北京百度网讯科技有限公司

申请日：2024-03-20

公开（公告）日：2024-06-14

公开（公告）号：CN118197410A

主分类号：G16B25/00

分类号：G16B25/00;G16B20/00

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本公开提供了一种蛋白质设计方法、装置、设备和介质，涉及人工智能领域，具体为深度学习、生物计算和大语言模型等技术领域。生成方法包括：构造多个候选蛋白质，其中每个包括原始蛋白质的第一链和基于原始蛋白质的第二链构造的非天然序列；检索得到第一链的第一多序列比对和非天然序列的第二多序列比对；利用预训练初始蛋白质语言模型将第一多序列比对和第二多序列比对匹配得到跨链同源序列；利用蛋白质结构预测模型预测候选蛋白质的结构和第一评分；基于第一评分确定奖励值并对初始蛋白质语言模型进行强化学习训练；利用训练后的目标蛋白质语言模型和蛋白质结构预测模型确定多个候选蛋白质各自的第二评分，以得到蛋白质设计结果。

主权项：1.一种蛋白质设计方法，包括：确定原始蛋白质，所述原始蛋白质包括第一链和第二链；基于所述第二链构造多个非天然序列，得到多个候选蛋白质，所述多个候选蛋白质均包括所述第一链，并且各自包括所述多个非天然序列中的一个非天然序列；在蛋白质数据库中检索得到所述第一链的第一多序列比对和所述多个非天然序列各自的第二多序列比对；利用预训练的初始蛋白质语言模型将所述第一多序列比对和所述候选蛋白质所包括的非天然序列的第二多序列比对进行匹配，以得到该候选蛋白质的多个跨链同源序列；利用蛋白质结构预测模型处理所述多个候选蛋白质各自对应的多个跨链同源序列，以得到所述多个候选蛋白质各自的预测结构和第一评分，所述第一评分表征对蛋白质结构的预测质量；基于所述第一评分确定奖励值，并基于所述奖励值对所述初始蛋白质语言模型进行强化学习训练，以得到目标蛋白质语言模型；以及利用所述目标蛋白质语言模型和所述蛋白质结构预测模型确定所述多个候选蛋白质各自的第二评分，以得到蛋白质设计结果。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司蛋白质设计方法、装置、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种适用于中、大粒径不规则种籽的排种器_石河子大学_201910333130.X

下一篇：一种抗鸡TLR15蛋白的多克隆抗体及制备方法_天津农学院_202210154569.8

相关技术

一种适用于中、大粒径不规则种籽的排种器_石河子大学_201910333130.X

一种抗鸡TLR15蛋白的多克隆抗体及制备方法_天津农学院_202210154569.8

一种长距离通信的电网无人机巡检系统及方法_国网山东省电力公司金乡县供电公司_202310722098.0

服务器获取客户端物理位置排布的方法_北京精确指向信息技术有限公司_201710163476.0

一种空煤气经导流缝隙预混后绕流多柱体均混的燃烧器_郑州釜鼎热能技术有限公司_202210090672.0

一种分区域机床热误差补偿方法_安徽工业大学_202210604031.2

一种锰锌铁氧体磁芯的高清洁度成型装置_天长市中德电子有限公司_202210205946.6

一种适用于太阳能建筑一体化的集热器_华春新能源股份有限公司_202111271524.0

一种天馈增益控制方法、计算设备及存储介质_东方空间技术(山东)有限公司_202310888439.1

一种活动式内扣平接龙骨_浙江亚厦装饰股份有限公司_202110959781.7

一种基于六参数模型的换热系统日负荷预测方法及系统_北京硕人时代科技股份有限公司_202310974685.9

一种低过采Staggered SAR成像方法及系统_中国人民解放军战略支援部队航天工程大学士官学校_202310881760.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】蛋白质设计方法、装置、设备和介质_北京百度网讯科技有限公司_202410324573.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务