本文来自微信公众号:中国工程院院刊(ID:CAE-Engineering),选自中国工程院院刊《Engineering》2021年第10期,作者:Sean O'Neill,原文标题:《人工智能机器人实验室前景广阔》,头图来自:视觉中国
最近,在世界各地几个实验室开展的精心设计的原理验证实验让人们得以一瞥未来。在未来,由人工智能引导的高通量自动化实验室可能会强化新材料(如清洁能源技术材料)的发现过程。而在化学工程领域,利用人工智能来辅助合成规划和性能,为科学家提供了这样一种前景:他们只需要一个想法和一个互联网连接,就可在最先进的远程实验室里生成新分子。
2020年8月,国际商业机器公司(IBM)宣布推出RoboRXN化学实验室,让人们看到了将人工智能和实验室自动化结合起来的潜力。该系统既可提供化学配方来生产目标有机分子,还可以通过市售的硬件,如IBM的演示器将这些分子自动合成。该演示器由位于瑞士Füllinsdorf 的Chemspeed Technologies公司制造,是一种Flex自动合成工作站(图1)。
图1 IBM的RoboRXN化学实验室系统合成分子的实时照片。在图的左下方,可以看到自动合成工作站6 个反应室中的几个。右边带着蓝色瓶盖的是装有配料的广口瓶。来源:IBM RoboRXN for Chemistry,经许可
最好将RoboRXN分为两部分进行考虑,即合成器硬件以及经化学合成实验程序训练的人工智能算法“大脑”,其中化学合成实验程序基于自然语言处理进行机器学习,从大约100 万项专利中提取有用程序。该处理过程甚至可以将用英语编写的非结构化实验程序转换为进行这些实验所需的结构化步骤,包括振荡、搅拌和加热等步骤。该系统的人工智能还可以预测复杂有机化学反应的结果。
重要的是,对于有兴趣设计和合成某些新的有机分子的科学家,该系统可以建议逆合成路线。换句话说,用户告诉它需要什么分子,系统就会提供生产这种分子的各种实用配方选择,主要提供用市售原料进行反应的配方。
IBM已经通过其云应用程序——RXN化学实验室将这一见解与人们无偿分享。位于瑞士苏黎世的IBM 欧洲研究中心的加速发现实验室(Accelerated Discovery at IBM ResearchEurope)的负责人Teodoro Laino说道:“挑战在于,你能否通过收集过去200 年的所有知识,训练出能够预测分子合成的模型,同时将这些知识转化为可由商业自动化硬件执行的指令?”
RoboRXN的原理验证实验表明,从本质上讲,这是可以做到的。首先,RoboRXN将化学配方转换成机器可读的指令,然后由一个能合成所需分子的自动化实验室执行该指令。那么,现实生产中该如何应用这样的系统?
Laino 说道:“对这种系统感兴趣的主要是制药领域,近年来,制药领域的化学品制造环节普遍外包。目前,越来越多的制药企业开始关注由自己来制造化学品。有了人工智能组件,科学家无需像以往那样必须花费几十年时间去开发某种化学品,自动化硬件的出现,使得各种流程的作业时间扩大到每天24 h。”
另一种实现人工智能机器人实验室的方法是实现研究和仪器的自动化。在2020年3月的一次论证报告中,英国利物浦大学的化学教授兼材料创新公司(Materials InnovationFactory)主任Andrew Cooper 领导的一个团队,利用德国奥格斯堡库卡公司(Kuka)生产的灵巧移动机器人,研究用水生产氢气的新型光催化剂(图2)。
该机器人自主运行了8天,完成了688项实验,每项实验分批进行,分16批次,测试了由10种不同的化学溶液组成的混合物,其中包括一种催化剂、两种表面活性剂和三种染料。随后用气相色谱法对每项实验进行评价,以确定实验效能。Cooper 说道:“在这个自动化机器人之前,学生每天只能亲手做一项实验。虽然出于安全考虑,这个机器人运行较慢,但它就像终结者——它永远不会停下来。它一周工作7天,一天工作24h,一次做16项实验。”
图2 英国利物浦大学Cooper 小组实验室运行中的“自动化研究员”。库卡移动机器人(KUKA Mobile Robot)可在82 cm范围内自如移动。该机器人通过结合激光扫描和触摸反馈确定自身的位置,从而进行精确定位。出于安全考虑,它移动缓慢,但与人相比,该机器人系统做实验的速度很快,因为它做实验是批量进行的,且“思考速度如闪电般快”,Andrew Cooper教授说道。来源:Andrew Cooper,经许可
Cooper表示,能处理如此多的变量是机器学习的独特优势。因为这个实验的“研究空间”包含了近1亿种可能的成分组合,该自动化系统采用贝叶斯优化算法来评估每个实验的结果(此处指实验中氢的产量),然后决定在下一批中试验哪些成分的混合物。当系统发现某种组合效果好时,它会尝试优化该组合,同时继续寻找“研究空间”中其他领域的成分。
Cooper 说道:“对于人类来说,在优化的同时进行新的尝试是非常困难的。它的维数太高了,人类的大脑甚至无法将其概念化。”他表示,人类化学家倾向于一次测试一个变量,而这种人工智能方法恰恰相反,它一次就能改变所有变量,每批实验都对其机器学习模型进行改进。实验结果表明,光催化剂混合物的活性是初始配方的6倍。
Cooper 表示,自动化研究的一大好处是,使提高实验室空间的处理能力变得更容易。“每个月我们都要增加一个新站点,以使我们的实验室空间变得更加复杂。目前我们正在研究X射线衍射。这项研究很重要,因为它可以帮助我们确定材料的结构——不仅仅是材料可以做什么,更重要的是材料是什么。”Cooper 400m2的实验室现在有两个机器人,还有两个正在订购中,所有这些机器人都可以作为一个团队一起工作。
加拿大不列颠哥伦比亚大学的研究人员也开发了一个由人工智能驱动的自动化材料科学平台,该平台旨在加速发现用于清洁能源技术的先进材料。该“自动驾驶”机器人平台名为Ada,无需人工监督即可生产和测试新型薄膜材料(图3)。
在一项旨在最大化钙钛矿太阳能电池中常用的电子-空穴传输材料的载流子迁移率的实验中,Ada通过制备三种溶液(包括氧化剂和掺杂剂)的混合物来制备薄膜。该系统以掺杂剂的相对浓度和退火时间作为输入变量,将这些混合物沉积到玻璃基板上,然后对其进行退火。退火后,自动测量每个样品的电学和光学特性。每个实验周期需要20min。试验结束后,该系统采用贝叶斯优化方法自行决定接下来要尝试的变量组合。Ada确定最佳钴浓度和退火时间用了35个循环(约12h)。
图3 哥伦比亚大学的Ada 机器人实验室平台是一个“自动驾驶”系统。该系统旨在加速用于清洁能源技术的新型薄膜材料的研发。中间左侧的浅色柱子顶部有一个铰接式机械臂。它前面的黑色柱子是一个基板存放架,正中间右侧的浅色圆柱体是旋涂仪。来源:UBC,经许可
与Cooper实验室中的机器人一样,Ada通过将人工智能与自动化结合起来,成功实现了在广阔的实验空间中快速导航。Ada项目经理Amanda Brown表示,Ada背后的加拿大团队目前有6个这样的平台,用于开展6个不同项目,其中一个旨在开发二氧化碳电解槽,以提高直接从空气中捕获碳的效果。
首席研究员兼不列颠哥伦比亚大学化学以及化学与生物工程学教授Curtis Berlinguette 说道:“这是一项集很多学科知识于一体的工作。我们的平台是由机电工程师、机械工程师、化学家、材料科学家、程序员和机器学习专家共同搭建的。”
尽管这项工作前景不可限量,但人工智能驱动的机器人实验室在导航方面仍然存在许多限制。美国马萨诸塞州剑桥市麻省理工学院的化学工程学助理教授兼药物发现与合成机器学习联盟(Machine Learning for Pharmaceutical Discovery and Synthesis Consortium,由麻省理工学院与13家生物制药和化学公司组成)成员Connor Coley说道:“总的来说,该领域的发展使得与更宏伟的目标所对应的更加困难的问题开始得到解决,但我感觉我们已经陷入这个概念验证阶段很长一段时间了。”
Coley 表示,自动化需要应对一系列挑战。Coley 的工作包括将人工智能驱动的合成规划与机器人自动化结合起来,用以生产药用化合物。“如果你的实验规模不是很小,那么放热反应就是一个问题。作为一个团队,我们在机器人分配固体药剂方面的工作仍然相对较差。一些反应性固体粉末往往会结块,因此准确分配这些粉末并精确称出特定质量的粉末仍然是一个问题。”
在IBM的RoboRXN化学实验室中,该团队目前使用的硬件无法执行多步骤化学过程中经常需要的那种纯化。Laino 说道:“如果你想净化某个化学试剂,就必须把它从循环中取出以完成净化,然后重新启动自动化过程,这对整个化学合成的性能有很大影响。”
如果这些挑战以及许多其他挑战在未来几年可以得到解决,人工智能驱动的机器人实验室不仅可以提供高通量的化学和材料研究,还可以进行更具创新性的研究。Cooper说道:“我有时太过于强调利用人工智能驱动机器人进行研究的速度,这不是重点。我们的根本目标始终是着眼于我们根本无法看到的事物。因为自动化的增强率如此之大,所以我们应该大胆进行一些猜测。”
然而,基于远程访问和扩展的组合,Laino对RoboRXN的未来的想象与其他人不同。“想象有一个大仓库,那里不是一个装满计算机的大数据中心,而是按照要求进行化学反应的机器人。突然,你看到了将这项技术应用在化学等领域的潜力。这场革命肯定需要一些时间,但这将极大地改变我们看待和研究化学的方式。”
本文来自微信公众号:中国工程院院刊(ID:CAE-Engineering),改编原文:Sean O´Neill.AI-Driven Robotic Laboratories Show Promise[J].Engineering,2021,7(10):1351-1353.