AlphaGenome, la herramienta de inteligencia artificial (IA) de Google hecha pública el miércoles, da un paso más en la comprensión del genoma al analizar cómo determinadas porciones del ADN regulan la actividad de los genes en la célula.
La decodificación del conjunto del genoma humano en 2003 “nos dio el libro de la vida, pero leerlo sigue siendo un desafío”, destacó Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, con motivo de la presentación de AlphaGenome en la revista Nature.
“Tenemos el texto” (la sucesión de tres mil millones de pares de nucleótidos A, T, C y G que componen el ADN), pero “comprender lagramática y la manera en que esta gobierna la vida constituye la próxima gran frontera de la investigación”, subrayó ante la prensa.
Lee también El impacto de un proyecto del genoma de 100 mil mexicanos
Solo 2% de las secuencias de ADN “codifican” directamente proteínas, indispensables para el funcionamiento de los organismos vivos.
El 98% restante desempeña un papel de “director de orquesta”: coordina, protege y regula la expresión de la información genética en cada una de nuestras células.
La decodificación del conjunto del genoma humano en 2003 “nos dio el libro de la vida, pero leerlo sigue siendo un desafío”, destacó Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, con motivo de la presentación de AlphaGenome en la revista Nature. Imagen: especial
Estas secuencias, llamadas “no codificantes”, contienen numerosas variantes asociadas a enfermedades.
Lee también Imagina predecir enfermedades y tener medicina personalizada por el ADN
Es justamente esto lo que AlphaGenome estudia, complementando otros modelos desarrollados por el laboratorio de IA de Google: AlphaMissense (análisis de las secuencias codificantes del ADN), AlphaProteo (diseño de proteínas) y AlphaFold (predicción de la estructura de proteínas, que obtuvo el premio Nobel de Química en 2024).
El modelo de aprendizaje profundo (en el que una red neuronal aprende a reconocer automáticamente patrones complejos) fue entrenado con datos procedentes de grandes consorcios públicos, que midieron experimentalmente estas propiedades en cientos de tipos de células y tejidos en humanos y ratones.
Es capaz de analizar una larga secuencia de ADN y “predecir” la influencia de cada par de nucleótidos en distintos procesos biológicosde la célula.