Codul genetic este limbajul universal al vieții – un sistem ordonat în care fiecare trei baze ADN desemnează unul dintre cei 20 de aminoacizi, iar fiecare ființă vie de pe Pământ folosește același alfabet de 20 de litere de miliarde de ani. Dar o echipă de la Columbia și Harvard, aparent plictisită de consens, a decis să vadă dacă poate concedia unul dintre acești aminoacizi. Mai exact, au proiectat o porțiune a ribozomului care funcționează fără izoleucină, una dintre cărămizile hidrofobe pe care proteinele le ascund în interiorurile lor care evită apa.
De ce să te deranjezi? Majoritatea cercetătorilor din domeniu sunt ocupați să adauge noi aminoacizi pentru a permite o chimie interesantă, nu să îi scadă. Dar echipa Columbia-Harvard are o întrebare mai existențială: înainte de ultimul strămoș comun universal al vieții, organismele probabil au experimentat cu coduri genetice mai mici și un amestec de proteine și ARN-uri catalitice. Am studiat ARN-urile catalitice din belșug, dar știm puține despre ce chimie este posibilă cu un set redus de aminoacizi. În plus, notează ei, instrumentele AI au devenit suficient de bune încât reproiectarea proteinelor pentru a folosi mai puțini aminoacizi este acum mai realistă decât era când Taylor Swift era încă o cântăreață country.
Izoleucina a fost aminoacidul sacrificial ales deoarece este unul dintre cei trei aminoacizi foarte asemănători, hidrofobi, doar carbon și hidrogen, cu catenă ramificată (împreună cu leucina și valina) care de obicei se ascund în interiorul proteinelor. O analiză a genomului E. coli a confirmat că izoleucina este aminoacidul cel mai frecvent înlocuit cu altul în proteine înrudite între specii. Așa că cercetătorii s-au întrebat: chiar avem nevoie de el?
Editarea tuturor celor aproximativ 4.500 de gene E. coli deodată ar fi o misiune sinucigașă, așa că au început cu una mică. Au luat 36 de gene esențiale și au înlocuit fiecare izoleucină cu valină. Pentru 22 dintre aceste gene, schimbarea a ucis celulele. Dar 17 gene au supraviețuit – inclusiv una care a avut izoleucina înlocuită în 45 de poziții diferite. Supraviețuitorii au crescut mai încet, totuși. Acea temă avea să reapară.
Echipa s-a concentrat pe proiectarea unui ribozom fără izoleucină – complexul masiv proteină-ARN care traduce ARNm-ul în proteine, practic hardware-ul care pornește o celulă vie din genomul său. Au înlocuit izoleucina cu valină în 50 de gene individuale de proteine ribozomale. Optsprezece au funcționat bine, 19 au crescut mai încet, iar 13 au fost letale. Apoi au folosit software de învățare profundă pentru proiectarea proteinelor pentru a sugera secvențe alternative fără izoleucină pentru cele 32 de gene cu fitness redus.
Testarea iterativă cu patru pachete AI diferite a produs secvențe funcționale pentru 25 dintre cele 32 de proteine. Pentru celelalte cinci, au forțat modificări la pozițiile izoleucinei și au lăsat software-ul să reproiecteze aminoacizii din apropiere pentru a compensa. Asta a funcționat pentru patru dintre cele cinci proteine problemă.
Pentru a testa dacă toate aceste proteine reproiectate pot asambla de fapt un ribozom funcțional, cercetătorii au vizat cele 21 de proteine ale subunității mici, ale căror gene sunt grupate convenabil pe o porțiune de ADN de 10.000 de baze. Pornind de la un capăt, au înlocuit 10 gene fără probleme. Înlocuirea a 17 dintre cele 21 a încetinit creșterea. Înlocuirea a 18 a ucis complet celulele. Lucrând din cealaltă direcție, au dat peste aceeași genă problemă: rplW. Lăsând rplW neatinsă în timp ce înlocuiau celelalte 20 de gene, au produs celule care creșteau cu aproximativ 70% din rata E. coli normal.
Privind mai atent, AI-ul compensase modificările izoleucinei din rplW prin ștergerea unor porțiuni mici de aminoacizi din apropiere – o soluție care funcționa singură, dar nu în combinație cu toate celelalte modificări. Așa că echipa a forțat soluția: au testat fiecare combinație de aminoacizi alternativi pentru cele patru poziții de izoleucină din rplW (16 modele în total). Un model a completat subunitatea mică fără izoleucină, tulpina rezultată crescând cu aproximativ 60% la fel de repede ca celulele needitate. După 400 de generații, celulele au acumulat 20-30 de mutații, dar niciuna nu a restaurat o izoleucină la vreo proteină ribozomală.
Notabil, dacă pui această rplW reproiectată înapoi în genom pe