加速认知螺旋,实验室来了“机器化学家”

走进中科院上海有机化学研究所综合楼一楼,一条人工智能(AI)化学实验线正在进行测试。如果一切顺利,它将在今年上半年正式投入使用。一位博士生花五年时间才能获得的数据,在这里只需一个月就能完成。而且,实验不会受到个人的实验技术水平、心情好坏、数据偏好等影响,可以确保实验数据规范准确。

人工智能驱动的科学研究(AI for Science)正在推动科研范式变革。AI在解放科学家双手、提高科研效率和准确性的同时,也在催生更多创新。在科学数据、算法、算力的支撑下,面向科研“第五范式”的智能化科学设施,将实现“AI科研助手+操作机器人+智能实验环境+可信多方协作”的高效迭代。

常规实验观察高度依赖人的体力和经验,而基于AI算法的无人实验将颠覆这一切。比如这条由上海科学家研发的AI化学实验线犹如一位“机器化学家”,让人类专家告别简单劳动,将智力集中于最前沿的创新探索。而这种“身边的变革”不仅发生在化学合成领域,不少新材料、药物发现等领域的实验室都已经与AI融合相伴,一个全新的科研时代已然来临。

告别摇试管、守仪器,节省三分之二的时间精力

根据实验方案,称量取样、放入通风橱开始实验,再将样品送入仪器分析——实验数据在送达研究者手中的同时,也进入数据库。无需多时,实验分析报告就传到了研究人员手中。这就是AI化学实验线未来的工作模式。

负责搭建AI化学实验线的上海有机所研究员左智伟觉得,实验线最大的优点之一就是可以把博士生从摇试管、守仪器这类简单重复劳动中解脱出来,“至少可以节省他们三分之二的时间和精力”。

事实上,无论有机、无机材料,抑或生物制药,实验步骤具有相当的共通性,主要以取样、顺序加料、设定反应条件、分析实验结果为主。这些程序性事务正是机器所擅长的。

之所以决定将引入AI这件事付诸行动,基于左智伟的一个粗略计算:五年学习毕业时,一名硕博连读生通常会有15本实验记录本,多的可能有30本。按每本100页计算,一般平均每页会有两条有效数据,那就相当于可以积累6000条反应数据。而AI化学实验线可以24小时运转,同时进行多个实验,只需一个月就能完成一个博士生五年的积累。

从事热电材料研究的中国科学院上海硅酸盐研究所陈立东研究员也有同样的感触。在国家科技部和上海市科委的支持下,上海多所高校与硅酸盐所联合开展了基于材料基因工程的新材料探索研究。得益于高通量计算、数据挖掘研究平台的建立,新型热电材料的筛选与性能优化的速度获得了成倍提升。

科研提速的同时,实验室收获的还有宝贵的研究智力。在左智伟看来,科研“体力活”的大幅减少,可让实验室里的年轻人把更多精力投入到对科学问题的思考中。而且,有AI帮助,人类专家萌生的各种科研想法能够更快地执行,“预测—分析—改进—再实验”的认知螺旋式上升也会推进得更快。最为重要的是,年轻人的科研兴趣不会被枯燥重复的实验所消磨,这会吸引更多人投身科研,从整体上加速科技创新。

从存量数据中“淘宝”,突破数据和算法瓶颈

人类从事科学研究的范式一直在“迭代”。几千年前是经验范式,几百年前是理论范式,几十年前是计算范式,十几年前是数据范式,而今是AI范式。近年来,“AI for Science”正在引发一场科学革命。AI在预测蛋白质结构、自然语言学习上的表现,不断在社会上引发高度关注。在这股变革大潮下,科学家们最关心的是如何实现数据和算法这两大核心要素的突破。

为发展AI化学,从2021年起,中科院上海有机所从国内外引进了多位青年人才,组成了20多人的研究团队,专攻AI驱动的有机合成。薛小松就是其中之一。“数据库是目前面临最大的难题。”他坦言,机器学习需要大量数据,应用也受限于数据。国外很久之前就开始布局科研数据库,在这方面有着丰厚的积累;相比之下,国内大量优秀论文发表在国外期刊上,有些“先天不足”。

为此,左智伟正带领团队努力挖掘存量实验数据。毕竟,“发表论文只会用到一小部分数据,而且往往带有结果导向的偏见”。而实验过程中会对成千上万种新催化剂、新配体进行研究,从这些存量数据中“淘”到AI训练所需要的“宝”,概率相当高。同时,他们也期待实验线早日启动,因为AI实验所产生的大量数据,也可用来“投喂”训练算法模型。

“计算除了需要数据输入,还需要给出算法、模型和判据。”陈立东说,早在十年前,国外就提出了“材料基因”的概念,而这正是如今“AI+材料”的前身,“可以说,材料就在那里,就看你用哪种工具去挖掘、去发现”。比如,北京科技大学谢建新教授就通过大数据挖掘,发现了一些传统合金性能最好的区域,使其长期以来未获突破的材料力学性能得到了进一步提升。

AI加盟科研,科学家的发现意识比以往更重要

“AI已这么能干了,还需要科学家吗?”面对这样的疑问,大多数科学家似乎并未惊慌失措。他们很清楚,AI是一种得力工具,可让更多研究者将智力集中于最前沿的创新。

大约十年前,中科院上海硅酸盐所研究员史迅的一位学生,在实验中无心插柳发现了一种“砸不碎”的半导体,具有金属延展性。后来,研究组发现其中蕴藏着一些新机制,可惜用传统试错的实验方法很难获得有效结果。于是,研究组运用高通量筛选的方法,很快得到了一批具有类似性能的材料。

史迅认为,“AI+材料”还处于起步阶段,需要广泛的学科交叉来建立研究体系。目前,上海硅酸盐所已建立起了计算材料研究中心、材料基因研究中心,为所内外不同方向的研究团队提供合作平台,拓展人工智能与材料研发的融合场景。

在迎接AI助手的同时,科学家愈发认识到“发现意识”的重要。不少研究者认为,在日常科研训练中,学生仍需要学会动手做实验,善于发现实验中的“秘密”。因为基础研究中的许多重大发现,往往就隐藏于“异常”的实验结果中。

“有了‘机器化学家’,可能会影响学生对于实验的深刻理解,因为对实验现象的观察被AI的加入屏蔽掉了,我们还需要找到其他训练方式来弥补这些隐性损失。”左智伟说,AI目前看来还无法主动思考实验过程中的机理,所以在为AI建立实验模型时,需要学生对科学问题的本质有更深入的了解与思考,未来一部分不具备独立思考能力的学生,很可能会被淘汰。

来源:文汇网

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com