当前位置:   article > 正文

如何使用alphafold进行蛋白质结构预测_alphafold预测蛋白结构教程

alphafold预测蛋白结构教程

AlphaFold 是 DeepMind 开发的一种基于深度学习的方法,用于预测蛋白质的三维(3D)结构,精确度极高。使用 AlphaFold 预测蛋白质结构的工作流程包括几个关键步骤:

(1)序列输入:
从相关蛋白质的氨基酸序列开始。该序列通常来自实验数据或基因组和蛋白质组数据库。

(2)多重序列比对(MSA):
将目标蛋白质序列与来自不同生物体的同源序列生成多重序列比对。MSA 提供了宝贵的进化信息,有助于提高结构预测的准确性。

(3)AlphaFold 预测:
利用在大量蛋白质结构数据集上训练过的 AlphaFold 深度学习模型来预测目标蛋白质的三维结构。AlphaFold 采用神经网络架构,将 MSA 和目标序列作为输入,预测蛋白质中残基对之间的距离。

(4)距离矩阵生成:
利用预测的残基间距离生成距离矩阵,该矩阵表示蛋白质中所有氨基酸残基间的成对距离。

(5)结构预测:
应用预测距离矩阵预测蛋白质原子的三维坐标。这一步骤包括解决距离几何问题,以确定最符合预测距离的原子空间排列。

(6)细化:
初始预测结构可能会经过细化,以提高其准确性。这可能涉及各种技术,如分子动力学模拟或能量最小化,以优化结构并消除任何立体冲突。

(7)结构评估:
评估预测蛋白质结构的质量。有多种指标和工具可用于评估预测结构的准确性和可靠性,包括均方根偏差(RMSD)和 MolProbity 分数。

(8)可视化和分析:
使用分子可视化软件对预测的三维蛋白质结构进行可视化和分析。研究人员可以检查结构的特定特征、活性位点或与配体或其他生物大分子的相互作用。

(9)验证:
可使用 X 射线晶体学、低温电子显微镜(cryo-EM)或核磁共振(NMR)光谱等技术对预测的蛋白质结构进行实验验证,以确认预测结构的准确性。

(10)应用:
预测的蛋白质结构可用于各种应用,包括药物发现、蛋白质工程、了解蛋白质功能以及研究蛋白质与蛋白质之间的相互作用。
AlphaFold 以快速和自动化的方式提供高精度的三维结构,彻底改变了蛋白质结构预测领域。它的应用扩展到广泛的生物和生物医学研究领域,为我们了解蛋白质功能和疾病机制做出了贡献。
(11)alpha-fold官方使用手册( https://www.deepmind.com/open-source/alphafold-protein-structure-database):
AlphaFold 是我们根据氨基酸序列预测蛋白质三维结构的人工智能系统。在 CASP14 中,AlphaFold 是排名最靠前的蛋白质结构预测方法,其预测准确率很高,其中许多预测结果与实验测定结果不相上下。

我们与欧洲生命科学旗舰实验室–EMBL欧洲生物信息学研究所 (EMBL-EBI) 合作创建了AlphaFold蛋白质结构数据库,向科学界免费提供这些预测结果。

2021年7月,我们发布了21种模式生物的预测结果(约33万个预测结果),涵盖了人类蛋白质组中的所有2万个蛋白质。 2021 年 12 月,我们从 Swiss-Prot 中添加了 44 万个新结构,其中包括社区手动策划和注释的关键蛋白质。最后,在 2022 年 1 月,我们根据世界卫生组织的优先列表,为 17 种被忽视的疾病生物和 10 种抗菌细菌添加了约 19 万个新结构。这使得可用结构总数接近 100 万。

现在,我们已将其扩展了 200 倍,可提供超过 2 亿个蛋白质的结构,几乎涵盖了科学界已知的所有编码蛋白质。 数据库的扩展包含了尽可能广泛的物种结构,包括植物、细菌以及其他动物和生物。这涵盖了 UniRef90 数据库中所有 1 亿个编目蛋白质的很大一部分。

AlphaFold 蛋白结构数据库将随着时间的推移不断更新和改进,因此如果您现在还找不到要找的内容,请关注 DeepMind 和 EMBL-EBI 的社交渠道,了解最新信息。在此期间,您可以使用 AlphaFold 源代码预测 AlphaFold 数据库中尚未包含的蛋白质结构,也可以使用 Colab 笔记本运行单个序列。

1、网址:https://alphafold.ebi.ac.uk/
在这里插入图片描述

2、下载PDB file
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/757546
推荐阅读
相关标签
  

闽ICP备14008679号