AI设计蛋白质:从科幻文本到生命工厂的钥匙

当《自然》主编Ewen Callaway尝试用自己搭建的初级AI设计蛋白质时,结果如同分子世界的抽象艺术——AlphaFold预测出的结构支离破碎,信心值低得可怜。这个看似失败的实验,却揭示了生物AI革命的最新篇章:人类正通过自然语言,直接与生命的分子机器对话。

只需一句“设计一个醇脱氢酶”,西湖大学原发杰团队开发的文本驱动模型Pinal就能输出数百种序列。更神奇的是,其中两个设计竟真的在实验室中催化了酒精分解。荧光蛋白、塑料降解酶…这些自然界从未有过的蛋白质,通过文本指令被凭空创造出来。原发杰称之为“如同科幻小说”,而Pinal模型已开放代码与界面,让普通人也能操作这“造物主”的键盘。

Pinal并非孤例:

初创公司310.ai的MP4模型根据文本设计出能结合ATP的全新蛋白质,正在挑战GLP-1类减肥药的设计高地;

ESM-3模型则融合了关键词、序列与结构的多模态输入;

威斯康星大学Anthony Gitter的团队通过文字描述成功设计出类药小分子抑制剂,对接计算显示其潜力。

文本驱动AI正在重塑生物学研究的逻辑。维也纳医科大学的CellWhisperer成为单细胞数据分析的“智能助手”,一句“详细描述这些细胞”就能将海量测序数据转化为清晰报告。耶鲁大学的Cell2Sentence更进一步,让AI在人类语言与细胞语言之间自由转译,甚至能预测药物对基因表达的调控——它阅读的不再是碱基序列,而是细胞自己的“语言档案”。

然而这场革命仍面临挑战。MP4模型有时会生成带有诡异重复序列的“蛋白质怪胎”,如同Dall-E画出扭曲的手指。Gitter曾让购物助手AI设计荧光蛋白,结果缺失了关键结构特征。哥伦比亚大学Mohammed AlQuraishi直言当前的语言界面“有些噱头”,但他也承认其潜力:“能精确指定需求并据此设计蛋白质,将是颠覆性的。”

当Callaway在Pinal界面输入“给我造个好蛋白质”时,AlphaFold终于给出了高置信度的预测——尽管那结构更像一盘意面混合体。这个看似幼稚的指令,却是人类探索生命语言边界的新起点:当AI将“设计生命元件”简化成一句人话,生物工程便从专家殿堂落入了大众的创造场域。

生物AI的语言革命正在催生一种全新的“分子民主化”。它瓦解了传统蛋白质设计的技术壁垒,将创新工具交到生物学家、药企研发者乃至科学爱好者手中。从酶、荧光蛋白到减肥药候选分子,文本驱动的AI不仅加速设计流程,更在拓展人类创造力的边界——当自然语言成为操控生命的密码,人类在生命科学领域的想象力,正迎来前所未有的解放。