赞
踩
在大分子药物研发领域,抗体药物和多肽药物由于其高特异性和卓越的安全性,近年来获得越来越多的关注度。
在抗体药物和多肽药物的研发中,抗原抗体复合体结构预测和多肽蛋白复合体结构预测都发挥着至关重要的指引性作用,其准确性对后续的研究至关重要。
但从目前的计算方法看,无论是基于物理方法的能量函数工具,还是基于深度神经网络的方法,包括最近DeepMind更新的AlphaFold 3等,在抗原抗体和蛋白多肽复合体的结构预测精度上,仍有较大的提升空间。
针对这一挑战,百度飞桨螺旋桨PaddleHelix团队研发出HelixFold-Multimer模型,通过在数据,网络结构及训练手段等多方面的优化,在抗原抗体/多肽蛋白复合体结构预测任务上,均达到业界领先。与现有方法比较,HelixFold-Multimer 在DockQ和成功率两个核心关键指标上,远超同类方法,也包括最新发布的AlphaFold 3。
抗原抗体结构预测效果
图一:HelixFold-Multimer 在抗原抗体测试数据集上的结果
使用2023年 1月25日 至 2023年8月9日 发布的 141 例抗原抗体复合体构象数据(具体PDB ID见附录),包括了130例普通抗体和11例ScFV。对比AlpahFold 3 在线服务输出结果(在线服务输出的5个结果中选择Confidence Score排序最高的 model 0 结果作为最终输出),HelixFold-Multimer模型在141例测试数据上,单模型DockQ均值达到 0.41 ,中位数0.38, 成功率达到 58.8%,超过最新发布的 AlphaFold3(DockQ均值0.29,中位数0.07,成功率38.9%)。
进一步地,在抗原抗体对接场景,我们可以通过实验手段(如 DMS,Deep Mutation Scaning)得到蛋白的表位信息,在已知表位信息情况下,HelixFold-Multimer(with epitope info)的精度可以进一步提升,DockQ 均值达到0.49,中位数达到0.54,成功率达到 77.1% ,相比AlphaFold3 几乎翻倍。
8saq 是针对HIV DH270的抗体,其特异性靶向HIV病毒表面的 V3 糖基结构。在这个例子中HelixFold-Multimer准确的预测了对接面,DockQ达到0.81,Interface RMSD 低于1Å。而 AlphaFold 3 输出的对接角度却预测不准,DockQ也只有0.03。具体case如图二所示。
图二:8saq上HelixFold-Multimer VS AlphaFold3
(灰色真实实验结果,红色HIV预测抗原,绿色抗体预测H链,蓝色抗体预测L链)
多肽蛋白结构预测效果
图三:HelixFold-Multimer 在多肽蛋白测试数据集上的结果
针对多肽场景,使用2022年1月16日到2022年12月12日期间PDB数据库释放的 61 例多肽蛋白复合体数据进行了测试,HelixFold-Multimer模型的效果相比其他方法具备明显优势。
使用 AlpahFold 3 官方服务预测得到5个结果,选取Confidence Score排序最高的 model 0 结果计算指标与HelixFold-Multimer进行了对比,如图三所示,HelixFold-Multimer预测均值DockQ达到0.378,中位数0.295,高于AlphaFold 3 的均值 0.359,中位数0.260。成功率上HelixFold-Multimer也远高于AlphaFold3(68.9% vs 59.0%)。
HelixFold-Multimer是百度文心大模型家族在生物计算方向上的最新工作,很高兴和大家分享现阶段性的成果。PaddleHelix团队已经将该模型应用在大分子药物管线研发中,并在2个靶点上找到活性在纳摩尔的候选药物分子。技术报告已经更新在arxiv上,线上服务同步开放。欢迎大家试用反馈。
在线体验地址
多肽蛋白:
https://paddlehelix.baidu.com/app/drug/protein-complex/forecast
抗原抗体:
https://paddlehelix.baidu.com/app/drug/KYKT/forecast
技术报告地址
https://arxiv.org/abs/2404.10260v2
联系我们
baidubio_cooperate@baidu.com
附录
抗原抗体测试数据(141例PDB ID):
7u9e 8ium 8iw9 8dzv 8dy1 8iuk 8dy5 8axh 7yue 7ua2 8cz8 8db4 8hc4 8epa 8hc5 8hhy 8hhx 7uxl 7xdk 7xcz 7xda 8ek1 8eka 7xdl 8c3v 8bcz 8d7e 7wnb 7wn2 8i5i 8saw 7umn 7xj6 8dto 8sb0 8sb1 8saq 8sar 7zjl 8say 8i5h 8sb5 8sas 8sb3 8sb2 7uja 7uow 8ct6 8sav 7xj8 7xj9 8sax 7xik 8heb 7xs8 8hec 7xil 8hed 8a96 8gs9 8f0h 8fax 8fg0 8a99 7xsa 7xrz 8bse 7yru 8bsf 7zqt 8dn6 8hn6 8hn7 7st5 8dn7 8f6o 8gb8 8gb6 8ahn 8f60 8cwi 8cwj 8gb7 8dnn 8cwk 7xsc 8f6l 8av9 8g3n 8g3v 8g3r 7xeg 7xjf 8gnk 8g3q 8ee1 8ee0 8g3p 8g3o 8dwy 8g3z 8g3m 8dww 7quh 8g30 8h07 8czz 7xei 8a44 8d9y 8eoo 8da0 8da1 8d9z 8e1m 8scx 8smt 7zoz 8e1g 8duz 8elo 8elq 8de4 8cim 8elp 8gtp 7yd1 8byu 8gtq 7y8j 8el2 8ol9 7yds 8ib1 7yv1 8dz3 8dyx 7trh 8e6j 7yk4 8e6k
多肽蛋白测试数据(61例PDB ID):
7aam 7acv 7acw 7e7c 7e9m 7eic 7eid 7fax 7fb8 7fba 7fc0 7fc0 7fc0 7fgj 7kqk 7n05 7oju 7ow1 7oxn 7pb4 7q4q 7q51 7qbs 7qqy 7quu 7qy5 7rc6 7rlw 7rlx 7rlz 7rm1 7rm3 7rqq 7rqr 7rsw 7rxq 7sjp 7ssc 7tcq 7u0a 7ulo 7urd 7urf 7uym 7v4w 7vcr 7vd7 7vlz 7wek 7wq3 7wq4 7wwq 7x2e 7x5c 7xjl 7y3j 7y3j 7y6c 7yx8 8des 8dgq
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。