遗传密码是生命的通用语言——一个整洁的系统,每三个DNA碱基对应20种氨基酸之一,地球上所有生物数十亿年来一直使用这同一套20字母字母表。但哥伦比亚大学和哈佛大学的一个团队,显然对共识感到厌倦,决定看看能否解雇其中一种氨基酸。具体来说,他们改造了核糖体的一部分,使其无需异亮氨酸即可工作——异亮氨酸是蛋白质喜欢藏在水避内部的一种疏水构件。

为什么要费这个劲?该领域的大多数研究人员正忙着添加新氨基酸以实现酷炫的化学功能,而不是减少它们。但哥伦比亚-哈佛团队有一个更存在主义的问题:在生命最后的普遍共同祖先之前,生物体可能尝试过更小的遗传密码以及蛋白质和催化RNA的混合体。我们已经充分研究了催化RNA,但对减少氨基酸集可能实现的化学性质知之甚少。此外,他们指出,AI工具已经足够好,以至于重新设计蛋白质使用更少的氨基酸现在比泰勒·斯威夫特还是乡村歌手时更加现实。

异亮氨酸被选为牺牲的氨基酸,因为它是三种高度相似、疏水、仅含碳和氢的支链氨基酸之一(与亮氨酸和缬氨酸一起),通常隐藏在蛋白质内部。对大肠杆菌基因组的分析证实,异亮氨酸是跨物种相关蛋白质中最常被其他氨基酸替换的氨基酸。所以研究人员问:我们真的需要它吗?

一次性编辑大肠杆菌所有约4500个基因将是一次自杀任务,所以他们从小处着手。他们选取了36个必需基因,将每个异亮氨酸替换为缬氨酸。其中22个基因的替换杀死了细胞。但17个基因存活了下来——包括一个在45个不同位置替换了异亮氨酸的基因。不过,存活者生长得更慢。这个主题会反复出现。

团队专注于工程化一个不含异亮氨酸的核糖体——这个巨大的蛋白质-RNA复合体将mRNA翻译成蛋白质,本质上是启动活细胞基因组的硬件。他们将50个核糖体蛋白基因中的异亮氨酸替换为缬氨酸。18个正常工作,19个生长变慢,13个是致命的。然后,他们部署了深度学习蛋白质设计软件,为32个适应性降低的基因建议不含异亮氨酸的替代序列。

用四种不同的AI软件包进行迭代测试,为32个蛋白质中的25个产生了可行的序列。对于剩下的5个,他们强制在异亮氨酸位置进行更改,并让软件重新设计附近的氨基酸以补偿。这对5个问题蛋白质中的4个有效。

为了测试所有这些重新设计的蛋白质是否真的能组装成一个功能性核糖体,研究人员瞄准了小亚基的21个蛋白质,其基因恰好聚集在一段10000碱基的DNA上。从一端开始,他们替换了10个基因,没有遇到麻烦。替换17个中的21个减慢了生长。替换18个完全杀死了细胞。从另一端工作,他们遇到了同一个问题基因:rplW。保持rplW不变,同时替换其他20个基因,产生的细胞生长速度约为正常大肠杆菌的70%。

进一步观察,AI通过删除附近氨基酸的小片段来补偿rplW中的异亮氨酸变化——这种修复单独有效,但与其他所有变化结合时无效。所以团队用蛮力解决了:他们测试了rplW中四个异亮氨酸位置的每种替代氨基酸组合(共16种设计)。一种设计完成了不含异亮氨酸的小亚基,所得菌株生长速度约为未编辑细胞的60%。经过400代后,细胞积累了20-30个突变,但没有一个将异亮氨酸恢复到任何核糖体蛋白中。

值得注意的是,如果你把这个重新设计的rplW放回基因组中……