Kod genetyczny to uniwersalny język życia – uporządkowany system, w którym każde trzy zasady DNA oznaczają jeden z 20 aminokwasów, a każda żywa istota na Ziemi używa tego samego 20-literowego alfabetu od miliardów lat. Ale zespół z Columbii i Harvardu, najwyraźniej znudzony konsensusem, postanowił sprawdzić, czy da się zwolnić jeden z tych aminokwasów. Konkretnie, zaprojektowali fragment rybosomu, który działa bez izoleucyny, jednego z hydrofobowych bloków budulcowych, które białka uwielbiają chować w swoich wodoodpornych wnętrzach.
Po co to komu? Większość badaczy w tej dziedzinie zajmuje się dodawaniem nowych aminokwasów, aby umożliwić fajną chemię, a nie ich odejmowaniem. Ale ekipa z Columbii i Harvardu ma bardziej egzystencjalne pytanie: zanim pojawił się ostatni uniwersalny wspólny przodek życia, organizmy prawdopodobnie eksperymentowały z mniejszymi kodami genetycznymi i mieszanką białek oraz katalitycznych RNA. Katalityczne RNA badaliśmy dużo, ale niewiele wiemy o tym, jaka chemia jest możliwa przy zredukowanym zestawie aminokwasów. Poza tym, jak zauważają, narzędzia AI stały się na tyle dobre, że przeprojektowanie białek tak, by używały mniej aminokwasów, jest teraz bardziej realistyczne niż w czasach, gdy Taylor Swift była jeszcze piosenkarką country.
Izoleucyna została wybrana na ofiarnego baranka, ponieważ jest jednym z trzech bardzo podobnych, hydrofobowych, złożonych tylko z węgla i wodoru aminokwasów rozgałęzionych (obok leucyny i waliny), które zazwyczaj chowają się wewnątrz białek. Analiza genomu E. coli potwierdziła, że izoleucyna jest aminokwasem najczęściej wymienianym na inny w pokrewnych białkach między gatunkami. Naukowcy zapytali więc: czy w ogóle jest nam potrzebna?
Edycja wszystkich około 4500 genów E. coli naraz byłaby misją samobójczą, więc zaczęli od małych kroków. Wzięli 36 niezbędnych genów i zastąpili każdą izoleucynę waliną. W przypadku 22 z tych genów zamiana zabiła komórki. Ale 17 genów przeżyło – w tym jeden, w którym izoleucyna została wymieniona w 45 różnych pozycjach. Ocalałe rosły jednak wolniej. Ten motyw miał się powtarzać.
Zespół skupił się na zaprojektowaniu rybosomu wolnego od izoleucyny – masywnego kompleksu białkowo-RNA, który tłumaczy mRNA na białka, czyli sprzętu, który uruchamia żywą komórkę z jej genomu. Wymienili izoleucynę na walinę w 50 pojedynczych genach białek rybosomalnych. Osiemnaście działało dobrze, 19 rosło wolniej, a 13 było śmiertelnych. Następnie użyli oprogramowania do głębokiego uczenia projektującego białka, aby zaproponować alternatywne sekwencje bez izoleucyny dla 32 genów o obniżonej sprawności.
Iteracyjne testy z czterema różnymi pakietami AI dały działające sekwencje dla 25 z tych 32 białek. Dla pozostałych pięciu wymusili zmiany w pozycjach izoleucyny i pozwolili oprogramowaniu przeprojektować sąsiednie aminokwasy, aby to skompensować. To zadziałało dla czterech z pięciu problematycznych białek.
Aby sprawdzić, czy wszystkie te przeprojektowane białka mogą faktycznie złożyć funkcjonalny rybosom, naukowcy celowali w 21 białek małej podjednostki, których geny są wygodnie skupione na odcinku DNA o długości 10 000 zasad. Zaczynając od jednego końca, zastąpili 10 genów bez problemu. Zastąpienie 17 z 21 spowolniło wzrost. Zastąpienie 18 zabiło komórki całkowicie. Pracując z drugiego końca, trafili na ten sam problematyczny gen: rplW. Pozostawienie rplW nietkniętego przy jednoczesnym zastąpieniu pozostałych 20 genów dało komórki rosnące z szybkością około 70 procent normalnego E. coli.
Przy bliższym przyjrzeniu się, AI skompensowało zmiany izoleucyny w rplW przez usunięcie małych fragmentów sąsiednich aminokwasów – poprawka, która działała sama, ale nie w połączeniu ze wszystkimi innymi zmianami. Zespół zastosował więc metodę brute force: przetestowali każdą kombinację alternatywnych aminokwasów dla czterech pozycji izoleucyny w rplW (łącznie 16 projektów). Jeden projekt ukończył małą podjednostkę wolną od izoleucyny, a powstały szczep rósł około 60 procent szybciej niż nieedytowane komórki. Po 400 pokoleniach komórki zgromadziły 20–30 mutacji, ale żadna nie przywróciła izoleucyny w żadnym białku rybosomalnym.
Co ciekawe, jeśli umieścić ten przeprojektowany rplW z powrotem w genomie na