当前位置:   article > 正文

对分子模拟轨迹数据的分析绘图_amber分析蛋白二级结构

amber分析蛋白二级结构

简介 

建立模型进行分子动力学模拟后,对得到的轨迹进行主成分分析(PCA),绘制相关性矩阵(Correlation Matrix)和自由能井图(Free Energy Landscape)和dssp图(Definition of Secondary Structure of Proteins)

绘制相关性矩阵图:

使用cpptraj计算轨迹的相关性矩阵

  1. #进入amber的cpptraj程序:
  2. cpptraj
  3. ##第一步,计算轨迹的平均结构:
  4. parm tyr.prmtop
  5. trajin tyr_500.crd
  6. #计算非H原子的rmsd,保存为数据集rmsd-dataset,选择第一帧为参考文件:
  7. rms rmsd-dataset first !@H=
  8. #根据轨迹计算结构的平均构象,保存为数据集average-dataset:
  9. average crdset average-dataset
  10. run

计算Cα原子的相关性矩阵,输出为ca_matrix.gnu文件:

  1. #利用1~30帧,计算所有CA的相关性矩阵,
  2. #输出文件为ca_matrix.gnu,保存数据集为ca_matrix:
  3. matrix covar out ca_matrix.gnu name ca_matrix start 1 stop 30 @CA

给数据前后补上脚本,具体例子如下:

  1. #设置保存为pdf文件
  2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
  3. set output "Correlation Matrix.pdf"
  4. set size square
  5. set pm3d map
  6. #设置色条颜色,rainbow色条:
  7. set palette rgb 30,31,32
  8. #差值法解决马赛克问题:0,0是插入的值,设置越大,马赛克消除效果越好。
  9. #0,0表示让系统自动优化:
  10. set pm3d interpolate 0,0
  11. #设置标题和轴标签:
  12. set title "Correlation matrix" font "Time New Roman,14"
  13. set xlabel "atom CA" font "Time New Roman,10"
  14. set ylabel "atom CA" font "Time New Roman,10"
  15. #隐藏图例:
  16. unset key
  17. #设置x,y轴范围:
  18. set yrange [1:265]
  19. set xrange [1:265]
  20. #设置轴的小刻度线:
  21. set mxtics 3
  22. set mytics 3
  23. #刻度线向外:
  24. set xtics out
  25. set ytics out
  26. #设置色条的刻度朝内:
  27. set cbtics in
  28. #隐藏对称的刻度轴:
  29. set tics nomirror
  30. #设置色条的刻度长度:
  31. set cbtics scale 3
  32. #绘图数据:
  33. splot "-" with pm3d title "pca-out.gnu"
  34. 1.000 1.000 1.000
  35. 1.000 2.000 0.904
  36. 1.000 3.000 0.703
  37. 1.000 4.000 0.523
  38. 1.000 5.000 0.709
  39. 1.000 6.000 0.753
  40. 1.000 7.000 0.638
  41. 1.000 8.000 0.649
  42. 1.000 9.000 0.694
  43. 1.000 10.000 0.665
  44. 1.000 11.000 0.621
  45. 1.000 12.000 0.598
  46. 1.000 13.000 0.586
  47. 1.000 14.000 0.549
  48. 1.000 15.000 0.509
  49. 1.000 16.000 0.505
  50. 1.000 17.000 0.511
  51. 1.000 18.000 0.549
  52. 1.000 19.000 0.608
  53. 1.000 20.000 0.572
  54. 1.000 21.000 0.582
  55. [过多的数据省略...]
  56. set output
  57. end
  58. pause -1

在gnuplot里拖入该gun文件。

查看绘制的效果:

相关性矩阵的图像呈对角线对称,色条两端颜色代表的区域对应的残基有着越强的运动相关性,颜色越浅的区域对应的残基运动相关性越弱。

用cpptraj进行蛋白质二级结构分析(DSSP)

编写cpptraj脚本dssp.in

  1. parm tyr.parm7 [top] #导入拓扑文件
  2. trajin tyr.nc parm [top] #导入100frame的轨迹文件
  3. center origin :236&!@H= mass #将残基236的质心作为盒子的中心对体系进行移动
  4. image origin center familiar
  5. reference tyr.pdb #导入坐标参考文件
  6. secstruct :15-68 out dssp15_68.gnu #计算15-68残基的dssp
  7. run
  8. quit

注意:这里reference tyr.pdb很重要,不用pdb文件,它识别不了提取的残基id 

运行脚本:

cpptraj dssp.in

运行gnuplot进行绘制:

gnuplot dssp15_68.gnu

调整gnu脚本:

  1. #设置保存为pdf文件
  2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
  3. set output "DefinitionofSecondaryStructureofProteins.pdf"
  4. set size square
  5. set pm3d map corners2color c1
  6. #隐藏图例:
  7. unset key
  8. #范围:
  9. set yr [1.000:54.000]
  10. set xrange [1.000:100.000]
  11. #刻度值:
  12. set ytics ("ILE:19" 5.000,"GLY:29" 15.000,"ARG:39" 25.000,"PHE:49" \
  13. 35.000,"GLN:59" 45.000,"PRO:68" 54.000) font "Times New Roman,10"
  14. set xtics ("0" 0,"20" 10,"40" 20,"60" 30,"80" 40,"100" 50,"120" 60,"140" 70,"160"\
  15. 80,"180" 90,"200"100) font "Times New Roman,10"
  16. #设置整个图表的空间(面积)大小:
  17. ##数值表示距离窗口左边界的距离:
  18. set lmargin at screen 0.15
  19. set rmargin at screen 0.85
  20. ##数值表示距离窗口下边界的距离:
  21. set tmargin at screen 0.78
  22. set bmargin at screen 0.20
  23. #标题和刻度标签:
  24. set xlabel "Time (ps)"
  25. set ylabel "residues"
  26. set title "Definition of Secondary Structure of Proteins 15-68"
  27. #刻度线条外翻:
  28. set tics out
  29. #色条的范围是 -0.5~7.5
  30. set cbrange [-0.0500:0.7500]
  31. #调整色条刻度值:
  32. set cbtics("None" -0.0500,"Extended" 0.05000,"Bridge" 0.1500,"3-10" \
  33. 0.2500,"Alpha" 0.3500,"Pi" 0.4500,"Turn" 0.5500,"Bend" 0.6500)
  34. set palette maxcolors 8
  35. set palette defined (0 "#000000",1 "#0000FF",4 "#00FF00",7 "#FF0000")
  36. #调整色条刻度线:
  37. set cbtics in
  38. set cbtics scale 2.8
  39. set tics nomirror
  40. splot "-" with pm3d title "dssp15_68.gnu"
  41. 1.000 1.000 0.0
  42. 1.000 2.000 0.0
  43. 1.000 3.000 0.7
  44. 1.000 4.000 0.0
  45. 1.000 5.000 0.0
  46. 1.000 6.000 0.0
  47. 1.000 7.000 0.1
  48. 1.000 8.000 0.1
  49. 1.000 9.000 0.1
  50. 1.000 10.000 0.1
  51. [过多的数据省略]
  52. set output
  53. end
  54. pause -1

利用cpptraj进行PCA分析绘制自由能井图

编写脚本pca.in:

  1. parm tyr.prmtop [p]
  2. trajin tyr.crd parm [p]
  3. rms rms-data :1-264&!@H= first #生成rmsd数据集
  4. run
  5. average crdset average-dataset :1-264&!@H= #生成平均构象数据集
  6. run
  7. createcrd tyr-trajectories-dataset #建立一个轨迹数据集
  8. run
  9. crdaction tyr-trajectories-dataset \ #计算这个轨迹数据集的rmsd,参考平均构象数据集
  10. rms ref average-dataset :1-264&!@H=
  11. crdaction tyr-trajectories-dataset \ #计算协方差矩阵
  12. matrix covar name tyr-covar-dataset :1-264&!@H=
  13. run
  14. runanalysis diagmatrix tyr-covar-dataset out tyr-evecs.dat \ #获取前3个特征向量
  15. vecs 3 name my-evecs \
  16. nmwiz nmwizvecs 3 nmwizfile tyr.nmd nmwizmask :1-264&!@H=
  17. crdaction tyr-trajectories-dataset projection TYR modes my-evecs \
  18. beg 1 end 3 :1-264&!@H=
  19. hist TYR:1 bins 25 out tyr-hist.agr norm name TYR-1
  20. hist TYR:2 bins 25 out tyr-hist.agr norm name TYR-2
  21. hist TYR:3 bins 25 out tyr-hist.agr norm name TYR-3
  22. hist TYR:1 TYR:2 bins 25 out pca-out.gnu norm name all_1_2 #将PC1和PC2输出为一个gnu文件
  23. run

运行脚本:

cpptraj pca.in

得到的图像有点马赛克感觉;而且色图外围还有一圈白色的留白;还有颜色也不是我们熟悉的红蓝色条的热图。

进行脚本的润色:

  1. #设置保存为pdf文件:
  2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
  3. set output "Free Energy Landscape.pdf"
  4. #必须要在splot末尾加上"set output"语句,否则保存的文件会损坏!
  5. set size square
  6. set pm3d map
  7. #设置色条颜色,rainbow色条:
  8. set palette rgb -31,13,22
  9. #差值法解决马赛克问题:0,0是插入的值,设置越大,马赛克消除效果越好。
  10. #0,0表示让系统自动优化:
  11. set pm3d interpolate 0,0
  12. #设置标题和轴标签:
  13. set title "Free Energy Landscape" font "Time New Roman,20"
  14. set xlabel "PC1" font "Time New Roman,20"
  15. set ylabel "PC2" font "Time New Roman,20"
  16. #隐藏图例:
  17. unset key
  18. #这里必须根据实际数据进行修改:
  19. set yrange [ -18.955: 22.277]
  20. set xrange [ -25.709: 22.280]
  21. #设置轴的小刻度线:
  22. set mxtics 3
  23. set mytics 3
  24. #刻度线向外:
  25. set tics out
  26. #隐藏对称的刻度轴:
  27. set tics nomirror
  28. ........(表示数据)
  29. #输出:
  30. set output
  31. end
  32. pause -1

查看保存的pdf图片:

 

编写脚本将概率值转换为相对自由能,再绘制FEL图:

使用origin软件绘制自由能井图:

将数据文件pca-out.gnu改为pca-out.dat,将里面和gnuplot有关的命令语法删掉,只保留数据值,导入origin里:

将第3列数据表示强度的数据列改为Z轴:

 对3列数据全选,在【工作表】-->【转化为矩阵】-->【xyz网格化】生成一个虚拟矩阵。

选择虚拟矩阵,选择【绘图】-->【等高线图】,调整调整

关于origin软件保存图片带有demo的水印的问题(提醒自己):

发现用修复工具之后,一段时间demo由会像蘑菇一样冒出来(F**k!),修复操作如下:

水印修复工具(就是那个Origin.exe文件),复制(不要移动)到安装目录里,替换里面原有的Origin.exe

打开安装目录下的Origin64.exe就能去掉水印啦。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/131747
推荐阅读
相关标签
  

闽ICP备14008679号