赞
踩
AlphaFold 是 DeepMind 开发的一种基于深度学习的方法,用于预测蛋白质的三维(3D)结构,精确度极高。使用 AlphaFold 预测蛋白质结构的工作流程包括几个关键步骤:
(1)序列输入:
从相关蛋白质的氨基酸序列开始。该序列通常来自实验数据或基因组和蛋白质组数据库。
(2)多重序列比对(MSA):
将目标蛋白质序列与来自不同生物体的同源序列生成多重序列比对。MSA 提供了宝贵的进化信息,有助于提高结构预测的准确性。
(3)AlphaFold 预测:
利用在大量蛋白质结构数据集上训练过的 AlphaFold 深度学习模型来预测目标蛋白质的三维结构。AlphaFold 采用神经网络架构,将 MSA 和目标序列作为输入,预测蛋白质中残基对之间的距离。
(4)距离矩阵生成:
利用预测的残基间距离生成距离矩阵,该矩阵表示蛋白质中所有氨基酸残基间的成对距离。
(5)结构预测:
应用预测距离矩阵预测蛋白质原子的三维坐标。这一步骤包括解决距离几何问题,以确定最符合预测距离的原子空间排列。
(6)细化:
初始预测结构可能会经过细化,以提高其准确性。这可能涉及各种技术,如分子动力学模拟或能量最小化,以优化结构并消除任何立体冲突。
(7)结构评估:
评估预测蛋白质结构的质量。有多种指标和工具可用于评估预测结构的准确性和可靠性,包括均方根偏差(RMSD)和 MolProbity 分数。
(8)可视化和分析:
使用分子可视化软件对预测的三维蛋白质结构进行可视化和分析。研究人员可以检查结构的特定特征、活性位点或与配体或其他生物大分子的相互作用。
(9)验证:
可使用 X 射线晶体学、低温电子显微镜(cryo-EM)或核磁共振(NMR)光谱等技术对预测的蛋白质结构进行实验验证,以确认预测结构的准确性。
(10)应用:
预测的蛋白质结构可用于各种应用,包括药物发现、蛋白质工程、了解蛋白质功能以及研究蛋白质与蛋白质之间的相互作用。
AlphaFold 以快速和自动化的方式提供高精度的三维结构,彻底改变了蛋白质结构预测领域。它的应用扩展到广泛的生物和生物医学研究领域,为我们了解蛋白质功能和疾病机制做出了贡献。
(11)alpha-fold官方使用手册( https://www.deepmind.com/open-source/alphafold-protein-structure-database):
AlphaFold 是我们根据氨基酸序列预测蛋白质三维结构的人工智能系统。在 CASP14 中,AlphaFold 是排名最靠前的蛋白质结构预测方法,其预测准确率很高,其中许多预测结果与实验测定结果不相上下。
我们与欧洲生命科学旗舰实验室–EMBL欧洲生物信息学研究所 (EMBL-EBI) 合作创建了AlphaFold蛋白质结构数据库,向科学界免费提供这些预测结果。
2021年7月,我们发布了21种模式生物的预测结果(约33万个预测结果),涵盖了人类蛋白质组中的所有2万个蛋白质。 2021 年 12 月,我们从 Swiss-Prot 中添加了 44 万个新结构,其中包括社区手动策划和注释的关键蛋白质。最后,在 2022 年 1 月,我们根据世界卫生组织的优先列表,为 17 种被忽视的疾病生物和 10 种抗菌细菌添加了约 19 万个新结构。这使得可用结构总数接近 100 万。
现在,我们已将其扩展了 200 倍,可提供超过 2 亿个蛋白质的结构,几乎涵盖了科学界已知的所有编码蛋白质。 数据库的扩展包含了尽可能广泛的物种结构,包括植物、细菌以及其他动物和生物。这涵盖了 UniRef90 数据库中所有 1 亿个编目蛋白质的很大一部分。
AlphaFold 蛋白结构数据库将随着时间的推移不断更新和改进,因此如果您现在还找不到要找的内容,请关注 DeepMind 和 EMBL-EBI 的社交渠道,了解最新信息。在此期间,您可以使用 AlphaFold 源代码预测 AlphaFold 数据库中尚未包含的蛋白质结构,也可以使用 Colab 笔记本运行单个序列。
1、网址:https://alphafold.ebi.ac.uk/
2、下载PDB file
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。