유전 암호는 생명의 보편적 언어다. 모든 세 개의 DNA 염기가 20개의 아미노산 중 하나를 지정하는 깔끔한 시스템이며, 지구상의 모든 생명체는 수십억 년 동안 이 동일한 20글자 알파벳을 사용해 왔다. 하지만 컬럼비아 대학과 하버드 대학의 연구팀은, 아마도 합의에 지루해져서, 그 아미노산 중 하나를 해고할 수 있는지 알아보기로 했다. 구체적으로, 그들은 이소류신 없이 작동하는 리보솜의 일부를 설계했다. 이소류신은 단백질이 물을 피하는 내부에 숨기기를 좋아하는 소수성 빌딩 블록 중 하나다.

왜 귀찮게? 이 분야의 대부분의 연구자들은 멋진 화학을 가능하게 하기 위해 새로운 아미노산을 추가하는 데 바쁘고, 빼는 데는 관심이 없다. 하지만 컬럼비아-하버드 팀은 더 실존적인 질문을 가지고 있다: 생명의 마지막 공통 조상 이전에, 유기체는 아마도 더 작은 유전 암호와 단백질과 촉매 RNA의 혼합물로 실험했을 것이다. 우리는 촉매 RNA를 많이 연구했지만, 축소된 아미노산 세트로 어떤 화학이 가능한지에 대해서는 거의 알지 못한다. 게다가, 그들은 AI 도구가 충분히 좋아져서 더 적은 아미노산을 사용하도록 단백질을 재설계하는 것이 테일러 스위프트가 여전히 컨트리 가수였을 때보다 더 현실적이 되었다고 지적한다.

이소류신은 희생양으로 선택된 아미노산인데, 그것은 단백질 내부에 숨는 경향이 있는 세 가지 매우 유사하고 소수성이며 탄소와 수소만으로 이루어진 가지형 아미노산(류신, 발린과 함께) 중 하나이기 때문이다. 대장균 게놈 분석은 이소류신이 종 간 관련 단백질에서 다른 아미노산으로 가장 자리 바뀌는 아미노산임을 확인했다. 그래서 연구자들은 물었다: 우리가 정말 그것을 필요로 할까?

대장균의 약 4,500개 유전자를 한 번에 편집하는 것은 자살 임무일 것이므로, 그들은 작게 시작했다. 그들은 36개의 필수 유전자를 가져와 모든 이소류신을 발린으로 대체했다. 그 유전자 중 22개에서 교체는 세포를 죽였다. 하지만 17개의 유전자는 생존했다. 그중 하나는 45개의 다른 위치에서 이소류신이 교체된 유전자도 포함되었다. 생존자들은 더 느리게 성장했다. 그 주제는 반복될 것이다.

팀은 이소류신 없는 리보솜을 설계하는 데 집중했다. 리보솜은 mRNA를 단백질로 번역하는 거대한 단백질-RNA 복합체로, 기본적으로 게놈에서 살아있는 세포를 부팅하는 하드웨어다. 그들은 50개의 개별 리보솜 단백질 유전자에서 이소류신을 발린으로 교체했다. 18개는 잘 작동했고, 19개는 더 느리게 성장했으며, 13개는 치명적이었다. 그런 다음 그들은 적응도가 낮은 32개 유전자에 대해 이소류신 없는 대체 서열을 제안하기 위해 딥러닝 단백질 설계 소프트웨어를 배치했다.

네 가지 다른 AI 패키지를 사용한 반복 테스트는 32개 단백질 중 25개에 대해 작동 가능한 서열을 생성했다. 나머지 다섯 개에 대해서는, 그들은 이소류신 위치에서 강제로 변경하고 소프트웨어가 근처 아미노산을 재설계하여 보상하도록 했다. 그것은 다섯 개의 문제 단백질 중 네 개에서 작동했다.

이 모든 재설계된 단백질이 실제로 기능성 리보솜을 조립할 수 있는지 테스트하기 위해, 연구자들은 작은 소단위의 21개 단백질을 대상으로 삼았다. 이 유전자들은 편리하게도 10,000염기 길이의 DNA 조각에 모여 있다. 한쪽 끝에서 시작하여, 그들은 문제없이 10개의 유전자를 교체했다. 21개 중 17개를 교체하자 성장이 느려졌다. 18개를 교체하자 세포가 완전히 죽었다. 반대 방향에서 작업하면서, 그들은 같은 문제 유전자인 rplW에 부딪혔다. rplW를 건드리지 않고 다른 20개 유전자를 교체하자 정상 대장균의 약 70% 속도로 성장하는 세포가 생성되었다.

자세히 살펴보니, AI는 rplW의 이소류신 변화를 근처 아미노산의 작은 부분을 삭제함으로써 보상했는데, 이 수정은 단독으로는 작동했지만 다른 모든 변화와 결합되면 작동하지 않았다. 그래서 팀은 무식하게 밀어붙였다: 그들은 rplW의 네 이소류신 위치에 대해 가능한 대체 아미노산의 모든 조합(총 16개 디자인)을 테스트했다. 하나의 디자인이 이소류신 없는 작은 소단위를 완성했고, 결과 균주는 편집되지 않은 세포의 약 60% 속도로 성장했다. 400세대 후, 세포는 20-30개의 돌연변이를 축적했지만, 어떤 것도 리보솜 단백질에 이소류신을 복원하지 않았다.

주목할 만하게, 이 재설계된 rplW를 게놈에 다시 넣으면...