人工智能系统预测可以结合或抑制目标的蛋白质片段

所有的生物功能都取决于不同的蛋白质如何相互作用。蛋白质之间的相互作用促进了从转录DNA和控制细胞分裂到复杂生物体的高级功能的一切。

然而,这些功能是如何在分子水平上协调的,以及蛋白质是如何相互作用的——无论是与其他蛋白质还是与自身的副本。

最近的研究表明,小的蛋白质片段具有很大的功能潜力。即使它们是不完整的片段,氨基酸的短片段仍然可以与目标蛋白质的界面结合,再现天然的相互作用。通过这个过程,它们可以改变蛋白质的功能或破坏它与其他蛋白质的相互作用。

因此,蛋白质片段可以增强蛋白质相互作用和细胞过程的基础研究,并可能具有治疗应用。

最近发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)上的一篇文章称,生物系开发的一种新方法基于现有的人工智能模型,可以计算预测大肠杆菌中可以结合和抑制全长蛋白的蛋白质片段。从理论上讲,这种工具可以产生针对任何蛋白质的基因可编码抑制剂。

这项工作是在生物学副教授和霍华德休斯医学研究所研究员Gene-Wei Li的实验室与Jay A. Stein(1968)生物学教授、生物工程教授和系主任Amy Keating的实验室合作完成的。

利用机器学习

这个名为FragFold的程序利用了人工智能模型AlphaFold,该模型近年来因其预测蛋白质折叠和蛋白质相互作用的能力而在生物学上取得了惊人的进步。

该项目的目标是预测片段抑制剂,这是AlphaFold的新应用。该项目的研究人员通过实验证实,即使研究人员之前没有关于这些相互作用机制的结构数据,FragFold对结合或抑制的预测中有一半以上是准确的。

“我们的研究结果表明,这是一种可推广的方法,可以找到可能抑制蛋白质功能的结合模式,包括新的蛋白质靶点,你可以把这些预测作为进一步实验的起点,”李实验室的博士后、共同第一作者安德鲁·萨维诺夫(Andrew Savinov)说。“我们真的可以将其应用于没有已知功能,没有已知相互作用,甚至没有已知结构的蛋白质,我们可以在我们正在开发的这些模型中增加一些可信度。”

其中一个例子是FtsZ,一种对细胞分裂至关重要的蛋白质。它被研究得很好,但包含一个本质上无序的区域,因此,特别具有挑战性的研究。无序蛋白质是动态的,它们的功能相互作用很可能转瞬即逝——发生得如此短暂,以至于目前的结构生物学工具无法捕捉到单个结构或相互作用。

研究人员利用FragFold来探索FtsZ片段的活性,包括内在无序区域的片段,以确定与各种蛋白质的几种新的结合相互作用。这一理解上的飞跃证实并扩展了之前测量FtsZ生物活性的实验。

这一进展之所以意义重大,部分原因在于它并没有解决无序区域的结构,也因为它展示了FragFold的潜在力量。

基廷说:“这是AlphaFold如何从根本上改变我们研究分子和细胞生物学的一个例子。”“人工智能方法的创造性应用,比如我们在FragFold上的工作,开辟了意想不到的能力和新的研究方向。”

抑制和超越

研究人员通过计算每个蛋白质片段,然后模拟这些片段如何与他们认为相关的相互作用伙伴结合,来完成这些预测。

他们将整个序列的预测结合图与这些相同片段在活细胞中的效果进行了比较,这些片段是通过高通量实验测量确定的,其中数百万个细胞每个产生一种蛋白质片段。

AlphaFold使用共同进化信息来预测折叠,并且通常在每次预测运行时使用称为多序列比对的东西来评估蛋白质的进化史。msa是至关重要的,但是对于大规模预测来说是一个瓶颈——它们可能会占用大量的时间和计算能力。

在FragFold中,研究人员预先计算了一次全长蛋白的MSA,并使用该结果来指导对该全长蛋白的每个片段的预测。

萨维诺夫与基廷实验室23届校友塞巴斯蒂安·斯旺森博士一起,预测除了FtsZ之外,还有多种蛋白质的抑制片段。在他们探索的相互作用中,脂多糖转运蛋白LptF和LptG之间的复合物。LptG的一个蛋白质片段抑制了这种相互作用,可能破坏了脂多糖的传递,而脂多糖是大肠杆菌外细胞膜的重要组成部分,对细胞适应性至关重要。

Savinov说:“令人惊讶的是,我们可以如此准确地预测结合,事实上,我们经常预测与抑制相对应的结合。”“对于我们研究过的每一种蛋白质,我们都能找到抑制剂。”

研究人员最初将重点放在作为抑制剂的蛋白质片段上,因为一个片段是否可以阻断细胞的基本功能是一个相对简单的结果,可以系统地测量。展望未来,Savinov还对探索抑制外的片段功能感兴趣,例如片段可以稳定它们所结合的蛋白质,增强或改变其功能,或触发蛋白质降解。

原则上的设计

这项研究是对细胞设计原理进行系统理解的起点,以及深度学习模型可以利用哪些元素来做出准确的预测。

“我们正在朝着一个更广泛、更深远的目标努力,”萨维诺夫说。“现在我们可以预测它们,我们是否可以利用我们从预测和实验中获得的数据来提取出显著特征,以弄清楚AlphaFold实际上了解了什么是好的抑制剂?”

Savinov和合作者还进一步研究了蛋白质片段如何结合,探索其他蛋白质相互作用和突变特定残基,以观察这些相互作用如何改变片段与目标的相互作用。

通过实验检查细胞内数千个突变片段的行为,一种被称为深度突变扫描的方法,揭示了负责抑制的关键氨基酸。在某些情况下,突变片段甚至比它们天然的全长序列更有效。

“与以前的方法不同,我们并不局限于在实验结构数据中识别碎片,”斯旺森说。“这项工作的核心优势是高通量实验抑制数据和预测结构模型之间的相互作用:实验数据引导我们找到特别有趣的片段,而FragFold预测的结构模型为片段在分子水平上的功能提供了一个具体的、可测试的假设。”

Savinov对这种方法的未来及其无数应用感到兴奋。

“通过创建紧凑的、基因可编码的粘合剂,FragFold为操纵蛋白质功能开辟了广泛的可能性,”李同意道。“我们可以想象提供功能化片段,可以修改天然蛋白质,改变它们的亚细胞定位,甚至重新编程它们,为研究细胞生物学和治疗疾病创造新的工具。”

作者:Lillian Eden | Department of Biology

链接:https://news.mit.edu/2025/ai-system-fragfold-predicts-protein-fragments-0220

著作权归作者所有。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com