当前位置:   article > 正文

分子对接软件UCSF DOCK的新功能介绍及安装

ucsf dock


前言

本文介绍学术开源分子对接软件UCSF DOCK的新功能及在Ubuntu22.04上的安装。


一、UCSF DOCK是什么?

在这里插入图片描述
UCSF DOCK是一种用于分子对接和虚拟筛选的计算软件套件。它由加州大学旧金山分校的Brian K. Shoichet实验室开发(DOCK6官网),作为最早出现的开源分子对接程序,于2002年首次公开发布。
主程序由C++编写,附加程序由C语言和Fortran 77编写,可以运行在Linux和macOS等类Unix操作系统;Windows用户需要使用Cygwin等类Unix环境模拟软件,具体可以参考:DOCK_on_cygwin

UCSF DOCK主要目标是根据小分子与蛋白质的结合亲和力进行分子对接,通过计算和评估大量的小分子构象和结合自由能来预测小分子与蛋白质的结合模式。也可以处理小分子-核酸,蛋白-蛋白,蛋白-核酸等体系。UCSF DOCK可以用于虚拟筛选,从大量的化合物库中挑选出具有潜在药物活性的化合物。

目前最新的版本是DOCK 6.11,学术用户可以通过注册免费获取相应版本的源代码。dock_license

DOCK 6系列版本可以说对前期版本做了诸多有益的补充。

V6.0版增加:多个scoring选项,包括在minimization阶段打分,GB/SA solvation scoring,PB/SA solvation scoring,考虑受体柔性的AMBER scoring,隐式溶剂的AMBER分子力学打分。

V6.1版新增功能包括:锚定和生长算法期间的新修剪算法,在primary scoring 和secondary scoring之间对配体执行排名和/或聚类的能力,当采用二次评分时输出更动态。

V6.2版新增功能包括:更好地控制构象输出,提高网格阅读的内存效率,连续评分的距离依赖性介电控制,以及AMBER评分更好的错误报告和制备脚本的鲁棒性,金属离子库,辅因子库,用户库链接,支持RNA受体,最小化收敛准则控制,以及跳过准备欠佳的配体。

V6.3版新增功能包括:更强大的输入文件处理,支持PB/SA评分的OpenEye Toolkits版本1.7.0,以及对RNA受体的AMBER评分改进支持,在准备过程中增加使用现有配体电荷的选项,以及更好的错误报告和制备脚本的鲁棒性。对于RNA受体的AMBER评分,距离可移动区域可以与隐式水一起应用,并且准备体系时将总电荷归零并且可以处理水溶剂化。

V6.4版新增功能包括:通过在分子生长各阶段包含内部能量函数来解决柔性配体的配体内部冲突(超过七个可旋转键);能够将生长树输出为多结构mol 2文件;在Dock输出文件中打印生长统计数据;使用RMSD tether限制性能量最小化。

V6.5版新添加特性包括:现在可以通过指定片段中的原子来选择锚定点。此外,在多锚定对接期间,可以限制所使用的锚定点的数量。引入了称为footprint score(the old descriptor score)的新评分函数,其中包括氢键项和footprint similarity scoring。PB/SA score已经做了一些泛化和效率改进,这使得对接,而不是重新评分,对于非常见系统更容易处理。对于AMBER评分,辅因子库,leaprc.dock.cofactors和离子库leaprc.dock.ions已经大幅增长。

V6.6版新增功能包括:新的基于网格的footprint score,基于SASA的评分功能,使用Hungarian算法计算RMSD,以及包含定向统计。

V6.7版新增功能包括:对几个输入参数的默认值的更新,这些参数主要基于艾伦等人使用大型数据集和采用多个指标进行的性能评估。

V6.8版新增功能包括:新的基于药效团的相似性评分功能,Tanimoto评分函数、Hungarian Matching Similarity评分函数、基于体积的相似性评分函数和混合“描述符”评分,以在DOCK中使用组合评分函数。

V6.9新功能包括:增强的化学搜索方法,称为:从头DOCK(DOCK_DN),这是一种从头设计方法,可用于从头构建分子或修饰现有分子框架。此外,一个新的片段库生成器功能被添加到对接中,并通过柔性配体对接功能实现。

V6.10新功能包括:一种增强的化学搜索方法,称为:分子进化DOCK(DOCK_GA),它是一种用于配体构建的基于进化的方法,采用breeding和突变的原理,将新的片段文库生成功能添加到对接方案中,将用于在对接期间提高速度的单纯形最小化步骤斜坡功能添加到对接方案中,将允许生成和评分没有受体分子的新评分功能(internal energy score)添加到对接方案中,将允许在最终系综中的重量分布的更柔和曲线的用于从头设计的分子量平滑功能添加到对接方案中。在6.1中引入的secondary score在此版本中已完全删除。

V6.11新功能包括:开源工具包RDKit与DOCK 6代码库的集成,允许用户计算分子的重要药物描述符。除了计算这些描述符的能力之外,DOCK6.11还包括DOCK_DN的增强版本,称为“descriptor-driven的从头设计”(DOCK_D3N)。这种方法允许用户指定描述符(及其目标范围)以偏置动态分子结构。这种强大而灵活的常规调整使配体生长朝向期望的化学空间。此外,RDKit被用于各种各样的DOCK特征,以计算所得分子的描述符。

DOCK软件包的运行流程包括以下几步:sphgen程序识别活性位点,和其感兴趣的潜在结合位点,并产生球中心填补结合位点。grid程序用于生成评分格点。DOCK程序将sphgen产生的球体与配体原子匹配,并使用评分格点(由grid产生)来评估配体取向,并完成能量最小化。
DOCK软件包的运行流程
UCSF DOCK具有以下特点:

  1. 灵活性:可以方便地适应不同的研究需求。用户可以根据需要选择不同的算法和参数来进行计算。
  2. 高吞吐量:可以处理大量的小分子和蛋白质结构,并在相对较短的时间内完成计算任务。
  3. 可视化支持:提供了可视化工具,可以帮助用户分析和可视化分子对接结果。

总而言之,UCSF DOCK是一个功能强大的分子对接及虚拟筛选软件套件,可用于药物发现和分子设计研究。它已经被广泛应用于药物发现、化学生物学和结构生物学等领域。

二、安装步骤

DOCK 6.9安装程序可以在网站申请license获得,以下是Linux Ubuntu系统上的安装流程:

1. 安装依赖:

sudo apt-get install build-essential byacc flex
  • 1

2. 解压缩和编译

tar zxvf dock.6.9_source.tar.gz 
cd dock.6.9_source/install
./configure gnu
make all
make dockclean
cd test
make test
make check
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

3. 设置环境变量

将以下PATH添加到~/.bashrc文件。

#UCSF-DOCK6
export PATH=$HOME/app/dock.6.9_source/bin:$PATH
  • 1
  • 2

4. 运行DOCK查看安装信息

您可以使用dock6命令来查看帮助信息和使用示例。
在这里插入图片描述

三、使用步骤

UCSF DOCK是一个复杂的软件包,使用时需要一定的背景知识和经验。建议参考官方文档和教程以获得更多关于UCSF DOCK的详细信息和指导。dock6_manual

Dock程序的用法:

    #USAGE: dock6 -i dock.in [-o dock.out] [-v]
    ##OPTIONS
    -i dock.in		#input file containing user-defined parameters
    -help 			#emit the usage statement.
    -v 				#verbosity flag that prints additional information and warnings for scoring functions
    -o dock.out 	#output file containing the parameters used in the calculation, summary information for each molecule docked, and all warning messages

    #Interactive mode
        USAGE: dock6 -i dock.in

    #Batch mode
        USAGE: dock6 -i dock.in -o dock.out

    #Parallel DOCK
        USAGE: mpirun [-machinefile machfile] [-np #_of_proc] dock6.mpi -i dock.in -o dock.out [-v]
    
    ##ADDITIONAL OPTIONS:
        -machinefile 	#simple text file containing the names of the computers (nodes) to be used
        -np 			#specifies the number of processors which typically is the same as the number of lines in the machinefile
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

总结

本文介绍分子对接软件UCSF DOCK的新功能及在Linux上安装,后续将结合案例介绍具体使用方法。
欢迎感兴趣的朋友留言讨论,批评指正。

参考资料

  1. Matos G.D.R; Pak S.; Rizzo, R.C. Descriptor-Driven de Novo Design Algorithms for DOCK6 Using RDKit. J. Chem. Inf. Model., 63(18): 5803-5822, 2023. https://doi.org/10.1021/acs.jcim.3c01031
  2. https://dock.compbio.ucsf.edu/DOCK_6/dock6_manual.htm#TableofContents

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/505220
推荐阅读
相关标签
  

闽ICP备14008679号