主页 > W生活城 >机器人也能当科学家(2-3) >

机器人也能当科学家(2-3)

機器人也能當科學家(2/3)

机器人能做的工作越来越繁多了,甚至可以包下科学家的工作:提出假说、做实验,并评估实验结果。虽然它算不算科学家仍有争议,但无疑是人类做研究时的好帮手。

(续前文)

拟定假说,策划实验

科学家所遵循的科学方法,是先拟定假说,演绎出结果,再用实验检验。同理,亚当会先提出关于酵母菌生物特性的新假说,然后用它的新陈代谢模型推论实验结果,最后做实验,看看观察到的结果是否符合假说的推论。

机器人也能当科学家(2/3)整个过程始于亚当提出假说:哪个基因可能是孤儿酶的父母(见左栏),接着亚当会用知识库来锁定最有可能成立的假说。例如,亚当知道2-胺基己二酸转胺酶这个孤儿酶,其催化的反应是2-氧代己二酸加L-麸胺酸,会产生L-2-胺基己二酸和2-酮戊二酸(上述反应可逆)。这个反应很重要,因为它或许能用来製造抗霉菌剂,但这个酶的父母基因不明。到底是酵母菌的哪个基因编译这个酶,为了拟定上述假说,亚当先查询知识库,看看是否有其他生物拥有编译这个酶的基因,结果查到褐鼠(Rattus norvegicus)的基因Aadat符合条件。

亚当取得了Aadat编译的酶蛋白质序列,然后查询酵母菌基因里是否能编译出类似的蛋白质序列。亚当知道,如果蛋白质序列够接近,就能合理推测它们有共同祖先。亚当也知道,如果蛋白质序列是同源的,共同祖先的功能或许会保留下来。因此亚当推论,编译出相似蛋白质序列的基因或许功能相同。亚当发现,酵母菌里YER152c、YJL060w和YJL202w这三个基因的序列与Aadat类似,于是提出假说:这三个基因都能编译2-胺基己二酸转胺酶。

亚当做了许多实验来检验这个假说。它的冷冻柜里有完整的酵母菌菌株,每种菌株都移除了某个基因。它从中选出移除了YER152c、YJL060w和YJL202w的酵母菌来培养,然后检查这三种菌株在某些化学物质(例如该酶催化反应中的L-2-胺基己二酸)中的生长情形。
下一步是菌株实验。科学研究的经费向来有限,科学家又常竞相解决问题,因此我们设计亚当时,就希望它能够策划有效率的实验,便宜又迅速地检验假说。为了达此目的,亚当为每个假说设定了「正确机率」。这种设定是有争议的,波柏(Karl Popper)等哲学家就否认假说有相对应的机率。然而大部份在做实验的科学家都默认,某些类型的假说比较可能成立。例如,他们通常遵守「奥坎剃刀」的观念,亦即一切条件相等时,简单的假说比複杂的更可能成立。亚当还会考虑实验成本──目前是化学药剂的成本,更好的做法应该也要考虑时间成本。

机器人也能当科学家(2/3)

我们给亚当设定的目标是,给定一组假说和相对应的可能性,以及可能的实验和相对应的成本,让它选择一连串的实验,用最小的期望成本,把假说淘汰到只剩一个。求最佳解的计算非常困难,但我们的分析显示,亚当选择实验所用的近似策略,与其他策略(例如只选最便宜的实验)相比,能更便宜快速地解决问题。有时亚当还能设计出一举釐清多个假说的实验。人类科学家很难做到这点,因为他们通常一次只考虑一个假说。

20个假说,12个新发现

亚当的人工智慧系统锁定最有希望的实验之后,就用它的机器设备来做实验并观察结果。亚当无法直接观察基因或酶,只能观察多少光穿透酵母菌菌落。亚当根据这些资料进行複杂的连锁推理,检验证据是否与它的假说一致。这种连锁推理在科学界很常见,例如天文学家用仪器观测辐射线,根据所得数据推论遥远星系中所发生的事。

判断假说是否成立,对亚当来说是最困难的任务,有些基因移除后会影响酵母菌的生长状况,科学家已经知道这类所有的基因。其他基因移除后通常只会造成生长时的微小改变。亚当运用高阶机器学习技术,来判断某个基因移除后所造成的微小变化是否会有显着的影响。

亚当拟定的「酵母菌哪个基因编译哪种酶」假说,有20个通过实验检验。正如科学家提出的所有科学主张,亚当的结论也必须受到检验。因此,我们用亚当手上没有的其他资讯来源,自己动手做新实验来检验亚当的结论,发现有7个是已知的,1个似乎是错的,12个是新发现。

我们自己动手实验确认了之前所述的三个基因能编译2-胺基己二酸转胺酶。这些基因先前没被发现的可能原因是,三个基因都编译同一个酶,这和一般认定一个基因编译一个酶的简单功能对应不符。亚当周密的实验和统计分析,对于解开这谜团至关重要。(待续)

上一篇: 下一篇: