Il codice genetico è il linguaggio universale della vita: un sistema ordinato in cui ogni tre basi del DNA codificano uno dei 20 amminoacidi, e ogni essere vivente sulla Terra ha usato questo stesso alfabeto di 20 lettere per miliardi di anni. Ma un team della Columbia e di Harvard, apparentemente annoiato dal consenso, ha deciso di vedere se poteva licenziare uno di quegli amminoacidi. Nello specifico, hanno ingegnerizzato una porzione del ribosoma che funziona senza isoleucina, uno dei mattoni idrofobici che le proteine amano infilare nei loro interni che evitano l'acqua.
Perché preoccuparsi? La maggior parte dei ricercatori nel campo è impegnata ad aggiungere nuovi amminoacidi per abilitare chimiche interessanti, non a sottrarli. Ma la squadra Columbia-Harvard ha una domanda più esistenziale: prima dell'ultimo antenato comune universale della vita, gli organismi probabilmente sperimentavano con codici genetici più piccoli e un misto di proteine e RNA catalitici. Abbiamo studiato gli RNA catalitici a sufficienza, ma sappiamo poco su quale chimica sia possibile con un set ridotto di amminoacidi. Inoltre, notano, gli strumenti di IA sono diventati abbastanza bravi che riprogettare proteine per usare meno amminoacidi è ora più realistico di quando Taylor Swift era ancora una cantante country.
L'isoleucina è stata l'amminoacido sacrificale scelto perché è uno dei tre amminoacidi ramificati molto simili, idrofobici, composti solo da carbonio e idrogeno (insieme a leucina e valina) che tipicamente si nascondono all'interno delle proteine. Un'analisi del genoma di E. coli ha confermato che l'isoleucina è l'amminoacido più frequentemente scambiato con un altro in proteine correlate tra specie diverse. Quindi i ricercatori si sono chiesti: ne abbiamo davvero bisogno?
Modificare tutti i circa 4500 geni di E. coli in una volta sarebbe una missione suicida, quindi hanno iniziato in piccolo. Hanno preso 36 geni essenziali e hanno sostituito ogni isoleucina con valina. Per 22 di questi geni, la sostituzione ha ucciso le cellule. Ma 17 geni sono sopravvissuti, incluso uno che aveva l'isoleucina sostituita in 45 posizioni diverse. I sopravvissuti crescevano più lentamente, però. Quel tema si sarebbe ripetuto.
Il team si è concentrato sull'ingegnerizzare un ribosoma senza isoleucina: il massiccio complesso proteina-RNA che traduce l'mRNA in proteine, essenzialmente l'hardware che avvia una cellula vivente dal suo genoma. Hanno sostituito isoleucina con valina in 50 singoli geni di proteine ribosomiali. Diciotto funzionavano bene, 19 crescevano più lentamente e 13 erano letali. Hanno quindi impiegato software di progettazione proteica basato su deep learning per suggerire sequenze alternative senza isoleucina per i 32 geni con fitness ridotto.
Test iterativi con quattro diversi pacchetti di IA hanno prodotto sequenze funzionanti per 25 di quei 32 geni. Per i restanti cinque, hanno forzato cambiamenti nelle posizioni dell'isoleucina e lasciato che il software riprogettasse gli amminoacidi vicini per compensare. Questo ha funzionato per quattro dei cinque geni problematici.
Per testare se tutte queste proteine riprogettate potessero effettivamente assemblare un ribosoma funzionale, i ricercatori hanno preso di mira le 21 proteine della subunità piccola, i cui geni sono convenientemente raggruppati in un tratto di DNA di 10.000 basi. Partendo da un'estremità, hanno sostituito 10 geni senza problemi. Sostituirne 17 su 21 ha rallentato la crescita. Sostituirne 18 ha ucciso completamente le cellule. Lavorando dall'altra direzione, hanno incontrato lo stesso gene problematico: rplW. Lasciando rplW intatto mentre sostituivano gli altri 20 geni, hanno prodotto cellule che crescevano a circa il 70% del tasso di E. coli normale.
Guardando più da vicino, l'IA aveva compensato i cambiamenti di isoleucina in rplW cancellando piccoli tratti di amminoacidi vicini: una soluzione che funzionava da sola ma non in combinazione con tutti gli altri cambiamenti. Quindi il team ha forzato la soluzione: hanno testato ogni combinazione di amminoacidi alternativi per le quattro posizioni di isoleucina in rplW (16 progetti in totale). Un progetto ha completato la subunità piccola senza isoleucina, con il ceppo risultante che cresceva circa al 60% della velocità delle cellule non modificate. Dopo 400 generazioni, le cellule hanno accumulato 20-30 mutazioni, ma nessuna ha ripristinato un'isoleucina in alcuna proteina ribosomiale.
Notevolmente, se si rimette questo rplW riprogettato nel genoma su