El código genético es el lenguaje universal de la vida: un sistema ordenado donde cada tres bases de ADN deletrean uno de 20 aminoácidos, y todo ser vivo en la Tierra ha usado este mismo alfabeto de 20 letras durante miles de millones de años. Pero un equipo de Columbia y Harvard, aparentemente aburrido del consenso, decidió ver si podían despedir a uno de esos aminoácidos. Específicamente, diseñaron una porción del ribosoma que funciona sin isoleucina, uno de los bloques hidrofóbicos que las proteínas adoran esconder en sus interiores que evitan el agua.

¿Por qué molestarse? La mayoría de los investigadores en el campo están ocupados añadiendo nuevos aminoácidos para permitir químicas geniales, no restándolos. Pero el equipo de Columbia-Harvard tiene una pregunta más existencial: antes del último ancestro común universal de la vida, los organismos probablemente experimentaron con códigos genéticos más pequeños y una mezcla de proteínas y ARN catalíticos. Hemos estudiado los ARN catalíticos bastante, pero sabemos poco sobre qué química es posible con un conjunto reducido de aminoácidos. Además, señalan, las herramientas de IA se han vuelto lo suficientemente buenas como para rediseñar proteínas usando menos aminoácidos, algo que ahora es más realista que cuando Taylor Swift todavía era cantante de country.

La isoleucina fue el aminoácido sacrificial elegido porque es uno de los tres aminoácidos ramificados, hidrofóbicos, solo carbono e hidrógeno, muy similares (junto con leucina y valina) que típicamente se esconden dentro de las proteínas. Un análisis del genoma de E. coli confirmó que la isoleucina es el aminoácido que más frecuentemente se intercambia por otro en proteínas relacionadas entre especies. Así que los investigadores preguntaron: ¿realmente la necesitamos?

Editar todos los 4500 genes de E. coli a la vez sería una misión suicida, así que empezaron pequeño. Tomaron 36 genes esenciales y reemplazaron cada isoleucina con valina. Para 22 de esos genes, el intercambio mató a las células. Pero 17 genes sobrevivieron, incluido uno que tenía isoleucina intercambiada en 45 posiciones diferentes. Los sobrevivientes crecieron más lento, eso sí. Ese tema se repetiría.

El equipo se centró en diseñar un ribosoma libre de isoleucina: el enorme complejo de proteína-ARN que traduce el ARNm en proteínas, esencialmente el hardware que arranca una célula viva a partir de su genoma. Intercambiaron isoleucina por valina en 50 genes individuales de proteínas ribosómicas. Dieciocho funcionaron bien, 19 crecieron más lento y 13 fueron letales. Luego desplegaron software de diseño de proteínas basado en aprendizaje profundo para sugerir secuencias alternativas sin isoleucina para los 32 genes con aptitud reducida.

Pruebas iterativas con cuatro paquetes diferentes de IA produjeron secuencias viables para 25 de esas 32 proteínas. Para las cinco restantes, forzaron cambios en las posiciones de isoleucina y dejaron que el software rediseñara los aminoácidos cercanos para compensar. Eso funcionó para cuatro de las cinco proteínas problemáticas.

Para probar si todas estas proteínas rediseñadas podían realmente ensamblar un ribosoma funcional, los investigadores apuntaron a las 21 proteínas de la subunidad pequeña, cuyos genes están convenientemente agrupados en un tramo de 10,000 bases de ADN. Empezando desde un extremo, reemplazaron 10 genes sin problemas. Reemplazar 17 de los 21 ralentizó el crecimiento. Reemplazar 18 mató a las células por completo. Trabajando desde el otro extremo, encontraron el mismo gen problemático: rplW. Dejar rplW intacto mientras se reemplazaban los otros 20 genes produjo células que crecían a aproximadamente el 70 por ciento de la tasa de E. coli normal.

Mirando más de cerca, la IA había compensado los cambios de isoleucina en rplW eliminando pequeños tramos de aminoácidos cercanos, una solución que funcionaba sola pero no en combinación con todos los demás cambios. Así que el equipo lo resolvió por fuerza bruta: probaron cada combinación de aminoácidos alternativos para las cuatro posiciones de isoleucina en rplW (16 diseños en total). Un diseño completó la subunidad pequeña libre de isoleucina, y la cepa resultante creció aproximadamente al 60 por ciento de la velocidad de las células no editadas. Después de 400 generaciones, las células acumularon de 20 a 30 mutaciones, pero ninguna restauró una isoleucina en ninguna proteína ribosómica.

Notablemente, si pones este rplW rediseñado de vuelta en el genoma en