Генетический код — универсальный язык жизни: аккуратная система, где каждые три буквы ДНК кодируют одну из 20 аминокислот, и все живое на Земле пользуется этим 20-буквенным алфавитом миллиарды лет. Но команда из Колумбии и Гарварда, видимо, заскучав от консенсуса, решила проверить, можно ли уволить одну из этих аминокислот. Конкретно, они сконструировали часть рибосомы, работающую без изолейцина — одного из гидрофобных строительных блоков, которые белки любят прятать в своих водонепроницаемых внутренностях.
Зачем? Большинство исследователей в этой области заняты добавлением новых аминокислот для крутой химии, а не вычитанием. Но команда из Колумбии и Гарварда задается более экзистенциальным вопросом: до последнего универсального общего предка жизни организмы, вероятно, экспериментировали с меньшими генетическими кодами и смесью белков и каталитических РНК. Каталитические РНК мы изучили предостаточно, но мало знаем о том, какая химия возможна с уменьшенным набором аминокислот. Плюс, отмечают они, инструменты ИИ стали настолько хороши, что перепроектирование белков с использованием меньшего числа аминокислот теперь более реально, чем когда Тейлор Свифт была кантри-певицей.
Изолейцин был выбран в качестве жертвенной аминокислоты, потому что это одна из трех очень похожих, гидрофобных, состоящих только из углерода и водорода разветвленных аминокислот (наряду с лейцином и валином), которые обычно прячутся внутри белков. Анализ генома E. coli подтвердил, что изолейцин — аминокислота, которую чаще всего заменяют на другую в родственных белках разных видов. Исследователи спросили: а нужен ли он нам вообще?
Редактировать сразу все 4500 или около того генов E. coli было бы самоубийством, поэтому начали с малого. Взяли 36 жизненно важных генов и заменили каждый изолейцин на валин. Для 22 из этих генов замена убила клетки. Но 17 генов выжили — включая один, в котором изолейцин был заменен в 45 разных позициях. Выжившие росли медленнее. Эта тема повторится.
Команда сосредоточилась на создании рибосомы без изолейцина — массивного комплекса белка и РНК, который транслирует мРНК в белки, по сути, аппаратное обеспечение, загружающее живую клетку из ее генома. Они заменили изолейцин на валин в 50 отдельных генах рибосомных белков. Восемнадцать работали нормально, 19 росли медленнее, а 13 были летальными. Затем они применили программное обеспечение для дизайна белков на основе глубокого обучения, чтобы предложить альтернативные последовательности без изолейцина для 32 генов с пониженной приспособленностью.
Итеративное тестирование с четырьмя разными пакетами ИИ дало рабочие последовательности для 25 из этих 32 белков. Для оставшихся пяти они принудительно изменили позиции изолейцина и позволили программе перепроектировать соседние аминокислоты для компенсации. Это сработало для четырех из пяти проблемных белков.
Чтобы проверить, могут ли все эти перепроектированные белки собрать функциональную рибосому, исследователи нацелились на 21 белок малой субъединицы, гены которых удобно расположены на участке ДНК длиной 10 000 оснований. Начиная с одного конца, они заменили 10 генов без проблем. Замена 17 из 21 замедлила рост. Замена 18 убила клетки полностью. Работая с другого конца, они наткнулись на тот же проблемный ген: rplW. Оставив rplW нетронутым и заменив остальные 20 генов, получили клетки, которые росли примерно на 70% от скорости нормальной E. coli.
При ближайшем рассмотрении ИИ компенсировал изменения изолейцина в rplW, удаляя короткие участки соседних аминокислот — исправление, которое работало само по себе, но не в сочетании со всеми остальными изменениями. Поэтому команда применила грубую силу: они протестировали каждую комбинацию альтернативных аминокислот для четырех позиций изолейцина в rplW (всего 16 вариантов). Один вариант завершил малую субъединицу без изолейцина, и полученный штамм рос примерно на 60% быстрее, чем неотредактированные клетки. Через 400 поколений клетки накопили 20–30 мутаций, но ни одна не вернула изолейцин в какой-либо рибосомный белок.
Примечательно, что если поместить этот перепроектированный rplW обратно в геном на