AI化学家会梦见电子云吗？

原创氘氘斋科学大院 2023-03-13

对于很多化学家（当然也包括其他实验科学）来说，做实验是件让人又爱又恨的事情。

此图虽是生物实验室主题，但“科研砖工”的日常大抵是相通的（来源：微信表情包“生物实验室的日常”）

笔者曾短暂从事过有机合成实验，其中的每个步骤都可能让人绝望。为什么一个看似简单的反应，每篇文章的条件都不一样，我要选择哪个？为什么文献看似轻巧地获得了漂亮的白色粉末，我得到的却是黑乎乎的一坨，产率还巨低？为什么过柱子的“水流”似乎永远没有尽头，好不容易得到的一管产物却不纯？

（来源：百度图片）

如果你没发出过上述“灵魂吐槽”，那只能说实验做少了！（手动狗头）

当我把这些问题抛给过来人时，他微微一笑，回答道：孩子，实验是门手艺，也是门玄学，慢慢磨吧。

当时就梦想着，这些琐碎的事情能自动完成就好了。幸运的是，现在梦想将要照进现实。

随着人工智能、机器学习、机器人学等领域飞速发展，化学家越来越有可能从繁琐、低效、危险的实验工作中解放出来。

算法进步：AI比你更高效

在海量数据中提取规律，寻求最优解的工作，人工智能或许比人类更优秀。这一点也很好去解释，勤勤恳恳的科研前辈们已经为我们积累了1.5亿个结构独特的分子，考虑到相互作用和活性，信息量超过1060。宇宙中的恒星数不过1024，人类大脑的神经元更是只有区区1011。所以，设计不出好的合成路线或分子结构，可能不怪我们学艺不精，而是怪我们“太笨”。

人类的“化学物质宇宙”（来源：Nature）

制药公司是最早开始使用人工智能（包括其前身人工神经网络）提高效率的工业领域。早在半个世纪前，药物化学家就开始用人工神经网络进行药物设计。从20世纪90年代开始，大型制药公司基本上都会使用定量构效关系QSAR指导药物开发。

随着算法的不断进步，今天的制药公司可以把积累的海量化合物生物活性数据“投喂”给人工智能，期望它能产出更精准的分子设计或选择。

设计好分子结构，下面就该思考合成路线了。这一步人工智能也能帮忙。面对一个新分子时，化学家的传统做法是在Scifinder或Reaxys中画好结构式，搜索出相关文献，当然这些工具也能给出一些逆合成分析。但非常初级，如果你照做的话，很可能会是浪费时间。

人工智能则可以在学习了海量化合物信息和合成路线后，给出最佳合成路线和反应条件。2018年，普林斯顿大学的研究者与默克公司合作，利用算法大幅提高了胺化反应的产率。同年，蔚山国立科学技术学院和波兰科学院的研究人员开发出了软件Chematica，设计出的合成路线不输于富有经验的合成化学家。最近，新版Chematica新增了复杂天然产物合成路线的设计功能。AI甚至通过了图灵测试，即专家无法判断一条合成路线是AI设计的还是人类设计的（文献发表）。

Chematica可以快速进行成千上万次逆合成分析，效率远超人类（来源：Chem）

Chematica提高合成效率的成功案例（来源：Chem）

技术再进步：AI走进实验室

不管人工智能的预测多么精准，实验结果才是衡量一切的标准。而真正让很多化学家头疼的也是完成或枯燥或危险的实验。这方面的进展比风起云涌的算法进步要慢一些，但技术进步永远“或迟但到”。

2020年7月，利物浦大学的研究人员发布了一款AI实验机器人，并登上了Nature封面。研究人员介绍，这款机器人可以独立完成所有类型的化学实验操作，例如称量固体或搭建反应装置。更关键的是，它能够根据一次反应的结果，对 10 个维度的变量进行分析，再从 1 亿多个候选化学实验中，确定下一步要进行的最佳实验。在测试挑战中，这台机器人在没有任何研究人员的指导下，进行了 688 次实验，工作了 192 个小时，其中移动319次，完成了 6500 次仪器操作，最终发现一种活性非常高的催化剂。这个成果足够一个硕士毕业了，但花费的时间却少得多。

利物浦大学开发的AI化学家在工作（来源：Nature）

不过，笔者始终觉得这台实验机器人差点意思。总体来说，它的工作方式并不够智能，强项是不知疲倦的身体和永不枯竭的耐心。不过从实验技术上来说，它已经相当不错了。

无独有偶，仅在一个月后，一款笔者认为极具革命性的产品——RoboRXN云端药物实验室发布了。开发者IBM仿佛闭关许久的武林名宿，一出手就不同凡响。RoboRXN项目开始于2018年初，同年IBM发布了它的初级版本，并免费提供预测服务。在用户反馈的基础上，RoboRXN不断优化，目前的准确率高达90%，据说位列化学反应预测类AI之首。

但它最大的特色还在于融合了人工智能、云技术和实验机器人三大功能。化学家只需要登陆网站，画出分子结构式，RoboRXN便能自动给出合成路线，并通过云技术将指令发送给远端的实验室，里面的机器人会完成所有的操作。不管是烦人的摸反应条件，还是危险的病毒实验，你要做的就是吃着火锅，唱着歌，等待结果报告。到这里，这个领域的“少林武当”均已产生，AI化学家已经初具雏形。但伴随着这些技术的发展，争议的声音也不曾间断。

RoboRXN云端实验室一角（来源：IBM）

两种质疑的声音

一种是质疑AI化学家是不是真的行？另一种则是反过来质疑它会不会太行了，最终取代人类化学家？

针对质疑的声音，美国化学会官方媒体C&EN曾经做过在线调查，约有45%的受访者认为AI在化学研究领域的风潮存在炒作现象。其中最令人担忧的恐怕就是体系的拓展性，即实用性。化学家经常碰到“换一个体系结果完全不同”的事情，而公开发表的文章往往会挑选最佳结果。因此，AI化学家的能力还需要更多实践检验。

超过45%的受访科学家认为AI在科研界有炒作之嫌

（来源：C&EN）

第二种担忧则更加主观，如何看待新技术对传统的冲击是见仁见智的事情。好的方面，AI提供的准确预测加上云端实验室和全自动机器人能够将研究人员从重复、劳累、有潜在危险的工作中解放出来，科学家能够把更多的精力投入到创新研究中。而且AI化学家的实验结果更为稳定、可追溯。坏的方面也显而易见，创新能力不足的研究者恐怕要忧心丢掉饭碗。“科研民工”虽是自嘲，但如果真的只会做实验，以后恐怕很难混。

不过AI完全取代人类进行科学研究似乎还有很长的路要走，且这条路不一定有尽头。化学以及其他实验科学的进步大致有两个动力源：对自然的好奇心和某种特定的需求。在满足需求方面，AI似乎可以做的比较好，但需求仍然需要人类来提，毕竟AI不会得病，也不需要吃药。更关键的好奇心，以目前AI的发展情况恐怕难以达到。而好奇心恰恰是无数科学进步的源泉。

不论是在发霉的橘子皮中诞生的青霉素，还是一个苹果砸出的万有引力定律，换成AI做主角恐怕很难演绎出精彩的科学发现。此外，笔者一直认为人类（科学家）是意外性NO.1的生物，17世纪德国的炼金术士想从尿液里提炼黄金，却意外发现了磷元素。稳定性既是AI的优势，也是它的短板——凡事都能预料，创新难以产生。

未来AI会发展成什么样子，笔者无法预测。不过现在，AI化学家会是人类化学家的好帮手。

参考文献:

[1] Predicting reaction performance in C–N cross-coupling using machine learning. Science, 2018, 360, 186-190

[2] Efficient Syntheses of Diverse, Medicinally Relevant Targets Planned by Computer and Executed in the Laboratory. Chem, 2018, 4, 522-532

[3] Chematica: A Story of Computer Code That Started to Think like a Chemist. Chem, 2018, 4, 390-398

[4] A mobile robotic chemist. Nature, 2020, 583, 237–241

[5] RoboRXN: Automating Chemical Synthesis. IBM Research Blog, 2020

[6] Computational planning of the synthesis of complex natural products. Nature, 2020

作者简介：化学博士，药企研发人员

版权说明：未经授权严禁任何形式的媒体转载和摘编，并且严禁转载至微信以外的平台！

文章首发于科学大院，仅代表作者观点，不代表科学大院立场。转载请联系cas@cnic.cn