赞
踩
分子对接(Molecular Docking)是分子模拟的重要方法之一,其本质是两个或多个分子之间的识别过程,其过程涉及分子之间的空间匹配和能量匹配。这项技术在药物研发、生物医学研究和药物设计中具有广泛的应用,可以帮助科学家理解分子如何相互作用,从而更好地设计和优化药物分子,以提高药物的疗效和选择性。
针对两个分子之间相互作用的模拟是一个相对复杂的问题。分子间相互作用中涉及许多力,主要包括:疏水作用(Hydrophobic)、范德华力(Van der Waals)、芳香氨基酸之间的堆积作用、氢键(Hydrogen bonding)和静电力(Electrostatic forces)。由于分子结构存在许多自由度,且溶剂分子对复合体的具体影响等未知因素使得模拟“配体-蛋白质”复合物中的分子间相互作用十分困难。将配体对接到受体结合位点的过程试图模拟配体和其受体之间的自然相互作用的最小能量。整个分子对接计算的过程主要包含构象搜索算法(Searching function)和打分函数(Scoring function)两部分,具体如下图所示。
构象搜索(Searching function)算法创建最佳数量的配置,其中包括实验确定的结合模式。尽管严格的搜索算法会遍历两个分子之间所有可能的结合模式,但由于搜索空间的大小和完成可能需要的时间,这种搜索是不切实际的。因此,只能对总构象空间的一小部分进行采样,因此必须在计算费用和检查的搜索空间量之间达到平衡。一些常见的搜索算法包括分子动力学、蒙特卡罗方法、遗传算法、基于片段、点互补和距离几何方法、禁忌和系统搜索。
打分函数(Scoring function)由许多数学方法组成,用于预测称为结合亲和力的非共价相互作用的强度。所有的计算方法的目标都是开发一种可以快速、准确地描述蛋白质和配体之间的相互作用的能量打分函数。目前主流的打分方程算法包括基于力场、半经验、基于知识、机器学习和一致性评价等。
基于力场的打分函数以分子力学计算为中心,包含范德华相互作用(Lennard-Jones 势)、静电相互作用(库仑势)和去溶剂化能等。这些力学参数可以从实验数据或从头算量子力学计算中得出。但由于计算成本的原因,在基于力场的打分函数中,溶剂化和熵项通常被过度简化或忽略。 GoldScore、DOCK 和 AutoDock 的早期版本等程序都使用这种类型的评分功能。
基于知识的打分函数由源自实验确定的蛋白质配体结构的统计势组成。许多蛋白质-配体复合物的特定相互作用的频率用于通过逆玻尔兹曼分布产生这些电势。这种方法使用大量的蛋白质-配体原子成对项来近似复杂且难以表征的物理相互作用。因此,打分函数缺乏直接的物理解释。DrugScore、ITScore 和 PMF 是基于知识的评分函数的示例
基于半经验的打分函数通过一组加权打分项来表征“蛋白质-配体”复合物的结合亲和力。这些打分项可能包括 VDW、静电、氢键、疏水、去溶剂化、熵等。他们的相应权重是通过线性回归拟合“蛋白质-配体”复合物的实验结合亲和力数据来确定的。基于经验的打分函数使用与基于力场的打分函数类似的组成项,每一项的贡献(权重)是从训练数据中学习的,类似于基于知识的评分函数。与基于知识的打分函数相比,由于物理项的限制,经验打分函数不太容易出现过度拟合。 例如 ChemScore、GlideScore、X-Score 和 Autodock Vina 等都是基于半经验的打分函数。
基于机器学习的打分函数是一组使用机器学习算法,通过关联训练数据中的模式来学习结合亲和力的函数形式的方法。在不采用预定函数形式的情况下,机器学习评分函数可以隐式捕获难以显式建模的分子间相互作用。近年来,ML 评分函数在结合亲和力预测方面显示出显着改进。
接下来是对一些分子对接软件的简介,主要分为开源分子对接软件、商业分子对接软件和基于深度学习的分子对接软件。
有许多开源的分子对接软件可供科学家和研究人员使用,这些软件提供了进行分子对接计算的工具和算法。以下是一些常见的开源分子对接软件:
AutoDock
AutoDock 最初是由分子图形实验室(现为 CCSB )的Oleg Trott博士所设计和实现,旨在预测小分子(例如底物或候选药物)如何与已知 3D 结构的受体结合。其多年来数次更新添加了许多新功能,并开发了多种引擎。当前的 AutoDock 发行版由两代软件组成:AutoDock 4 和 AutoDock Vina。AutoDock目前(2023年9月)被引用1,878次。
AutoDock-GPU
AutoDock-GPU是 AutoDock4.2.6 的OpenCL和Cuda加速版本,充分利用了易于并行化的拉马克遗传算法(Lamarckian Genetic Algorithm,LGA)特性,通过在多个计算单元并行计算“配体-受体”复合物构象。OpenCL版本是与德国达姆施塔特工业大学(TU-Darmstadt)合作开发,支持在CPU、GPU和FPGA架构上运行。而Cuda版本则是与Nvidia合作开发,将其扩展至 Summit 超级计算机的 27,612 个 Nvidia V100 GPU 上,最终相对于CPU版本达到了350倍加速,并获得了2020年戈登贝尔特别奖( Gordon Bell COVID-19 Special Prize)的提名。
AutoDock Vina
AutoDock Vina也同样是由分子图形实验室(现为 CCSB)Oleg Trott博士开发的全新算法的开源分子对接软件,也是 AutoDock Suite 的对接引擎之一。相较于AutoDock,Vina在准确性和性能方面显着提高,是目前最受欢迎的对接软件之一。因此,基于Vina涌现出大量的开源程序,如smina、Vinardo、QuickVina、Vina-GPU、Uni-Dock等。AutoDock Vina目前(2023年9月)已经被引用达25,797次,AutoDock Vina 1.2.0被引用达1,030次。
Vina-GPU 2.0
Vina-GPU 2.0是南京邮电大学吴建盛课题组研发的基于GPU加速的AutoDock Vina的最新版本。值得一提的是,Vina-GPU 1.0已经在NVIDIA RTX 3090 GPU上实现了对AutoDock Vina的14倍加速。Vina-GPU 2.0在此基础上进一步加速了AutoDock Vina。蛋白激酶靶标RIPK1和RIPK3的虚拟筛选结果表明,相对于AutoDock Vina、QuickVina 2和QuickVina-W,Vina-GPU 2.0的平均对接加速分别达到了65.6倍、1.4倍和3.6倍。Vina-GPU 2.0的代码和工具可以在https://github.com/DeltaGroupNJUPT/Vina-GPU-2.0免费获取,并提供了清晰的说明和示例。
Vinardo
Vinardo (Vina RaDii Optimized)基于AutoDock Vina,并通过一种新颖的方法在数据集上进行训练。Vinardo的打分功能可作为 Smina中的一个选项,可从 http://smina.sf.net 免费获取。
QuickVina2 & QuickVina-W
QuickVina2和 QuickVina-W通过允许 AutoDock Vina 的搜索线程与搜索空间的记录进行通信来减少搜索中的冗余。
smina
smina是AutoDock Vina的改进版本,修改其源代码以支持自定义打分方程并提高打分和最小化工作流程的性能。例如,smina 可以使用 OpenBabel 自动计算配体的部分电荷,处理多构象文件(例如 sdf 文件),在最小化大量配体时速度提高 10-20 倍,并支持用户指定的打分方程。在CSAR (Community Structure-Activity Resource) 2010数据集测试中,与AutoDock Vina 相比,smina在构象预测方面略胜一筹。
Uni-Dock
Uni-Dock是由深势科技(DP Technology)开发的基于GPU加速的分子对接程序,支持使用AutoDock Vina、Vinardo和AutoDock4的打分方程。与单 CPU 核心运行的AutoDock Vina相比,Uni-Dock 在V100 GPU上实现了超过 1000 倍的加速。
UCSF DOCK
UCSF DOCK是一个用于高通量虚拟筛选的开源分子对接软件,专注于寻找药物候选化合物。UCSF DOCK的打分方程包括:Delphi静电(Delphi Electrostatics)、配体构象熵校正(Ligand Conformational Entropy Corrections)、配体去溶剂化(Ligand Desolvation)、受体去溶剂化(Receptor Desolvation)。
SwissDock
SwissDock是一个基于Web的分子对接平台,使用EADock DSS 进行对接计算。SwissDock提供用户友好的界面,并且允许用户上传蛋白质(PDB id、Name、Sequence or URL)和小分子(ZINC AC, Name, Category)的结构来进行对接。作业完成后,将通过邮件方式发送包含参考复合体和预测结合模式的链接。
Plants
PLANTS (Protein−Ligand ANT System)是一个用于分子对接和虚拟筛选的开源软件,采用蚁群优化(Ant Colony Optimization, ACO)算法进行构象搜索。
rDock
rDock 是一种快速且多功能的开源对接程序,可用于将小分子与蛋白质和核酸对接,专为高通量虚拟筛选 (High throughput virtual screening, HTVS) 和结合模式预测研究而设计。
LeDock
LeDock是苏黎世大学赵博士开发的一款分子对接软件,在对接速度和准确度上均呈现出强劲的优势。LeDock采用模拟退火-遗传算法交叉的算法进行构象搜索,对接打分涵盖范德华相互作用(vdw),静电相互作用(Coulombic interaction),氢键贡献(Hbond)以及分子间(inter)和配体分子内(intra)的冲突(clash)几项的和做为打分方程。
Δ
G
=
α
∑
i
ε
l
i
g
(
E
i
v
d
w
+
E
i
h
b
)
Θ
(
E
c
o
−
E
i
v
d
w
−
E
i
h
b
)
+
β
(
r
)
∑
i
ε
l
i
g
∑
j
ε
p
r
o
q
i
q
j
/
r
i
j
+
λ
E
l
i
g
s
t
r
a
i
n
\Delta G = \alpha \sum_{i \varepsilon lig}(E_{i}^{vdw}+E_{i}^{hb}) \Theta (E_{co}-E_{i}^{vdw}-E_{i}^{hb}) + \beta (r) \sum_{i \varepsilon lig} \sum_{j \varepsilon pro} {q_i q_j}/r_{ij} + \lambda E_{lig}^{strain}
ΔG=αiεlig∑(Eivdw+Eihb)Θ(Eco−Eivdw−Eihb)+β(r)iεlig∑jεpro∑qiqj/rij+λEligstrain
ZDOCK
ZDOCK 是由马萨诸塞大学医学院创建的基于快速傅里叶变换(Fast Fourier Transform)的刚性蛋白质对接程序。ZDOCK 将搜索两种蛋白质的所有平移和旋转空间,然后对每个可能的构象进行打分。打分方程基于能量,包含计算势能、空间互补性和电场力。
RosettaDock
RosettaDock 是一个用于“蛋白质-蛋白质”或“蛋白质-配体”相互作用的计算机模拟和蛋白质结构预测的软件工具,它是Rosetta软件套件的一部分。Rosetta 是一个广泛用于蛋白质结构预测、蛋白质折叠、蛋白质-蛋白质和蛋白质-配体相互作用等生物信息学任务的计算生物学工具。
随着人工智能(AI)的发展,DeepDocking和GNINA等模型一些努力尝试在大型分子数据库的子集上训练深度学习(DL)模型预测其对接打分。
DeepDocking
DeepDocking是一个新颖的深度学习平台,适合快速而准确地对接数十亿个分子结构,该方法利用在化学库子集的对接分数上训练的定量构效关系 (Quantitative Structure–Activity Relationship, QSAR) 深度模型来近似尚未处理的条目的对接结果,从而以迭代方式去除不利的分子。
gnina
发音为: NEE-na,是一个分子对接程序,支持使用卷积神经网络 (Convolutional neural networks, CNNs)对配体进行评分和优化。它是smina的一个分叉,而smina是AutoDock Vina的一个分叉。源码网址: https://github.com/gnina/gnina.
HAC-Net
HAC-Net (Hybrid Attention-Based Convolutional Neural Network)一种基于混合注意力的卷积神经网络,用于高精度蛋白质-配体结合亲和力预测。
DiffDock
将分子对接视为生成建模问题开发了DiffDock,这是一种针对配体构象的非欧几里得流形的扩散生成模型。结果显示,DiffDock 在 PDBBind 上获得了 38% 的 top-1 成功率(RMSD<2A),显着优于之前最先进的传统对接(23%)和深度学习(20%)方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。