人工智能AlphaFold预测2.14亿蛋白结构

蛋白质是生命的基石,由氨基酸链组成,并折叠成复杂的形状。由于蛋白质的形状与其功能密切相关,因此,了解蛋白质的结构可以更好地了解其作用和工作原理,这也是解决许多生命科学问题的关键,例如为疾病设计新的疗法或疫苗,或解决粮食安全问题和环境污染问题等。

DeepMind公司与欧洲生物信息研究所的合作团队公布了生物学领域的一项重大飞跃。他们利用人工智能(AI)系统AlphaFold预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。这一突破将加速新药开发,并为基础科学带来全新革命。该研究发布于《Nature》。


据悉,AlphaFold 对蛋白质形状的预测,可以达到原子、尺寸和分钟级别的精确程度。许多AlphaFold预测的结构足够好,可以在某些应用中取代实验结构。或者,研究人员可以使用AlphaFold预测来验证和理解实验数据。不好的预测结果往往是显而易见的,其中一些是由蛋白质本身的内在无序性造成的,这意味着它没有明确的形状。


目前,免费结构已被添加到类似 UniProt、Ensembl 和 OpenTargets 等数据集中,已有来自 190 个国家、超过 50 万名研究人员对 AlphaFold 进行了访问,数百万用户将数据集的访问作为日常工作的一部分。


不仅如此,基于 AlphaFold 代码的开源,该公司在Nature上刊发的两篇论文也得到超过 4000 次的引用。


DeepMind的创始人兼首席执行官Demis Hassabis在发布的声明中表示,从本质上讲,最新公布的预测已经涵盖了整个蛋白质世界,包括动物、植物、细菌、真菌和其他生物体的预测结构。这一进展为AlphaFold在可持续性、粮食安全和被忽视的疾病等重要问题产生的影响开辟了巨大的新机会。