Un grupo de investigadores del Instituto Tecnológico de Massachusetts (MIT) ha desarrollado una innovadora técnica que utiliza inteligencia artificial generativa para determinar la estructura tridimensional del genoma en las células. Este avance representa un progreso significativo en la comprensión de cómo la estructura del ADN influye en la expresión génica, lo que resulta fundamental para el estudio de diversas funciones celulares.
Cada célula del cuerpo humano contiene la misma secuencia genética, pero la expresión de los genes varía entre diferentes tipos de células. Esta variabilidad está en parte determinada por la organización espacial del material genético, que regula la accesibilidad de cada gen. Tradicionalmente, los métodos experimentales para analizar estas estructuras han sido laboriosos y requerían un tiempo considerable para obtener resultados. Sin embargo, la nueva técnica presentada por los investigadores del MIT promete acelerar este proceso de manera notable.
De la secuencia a la estructura
El ADN en el núcleo celular se organiza en una estructura compleja llamada cromatina, que permite que dos metros de ADN se compacten en un núcleo de tan solo una centésima de milímetro de diámetro. Las modificaciones epigenéticas, que son etiquetas químicas adjuntas al ADN, influyen en el plegamiento de la cromatina y en la accesibilidad de los genes adyacentes. Estas diferencias en la conformación de la cromatina son esenciales para determinar qué genes se expresan en cada tipo celular y en diferentes momentos dentro de una misma célula.
Durante las últimas dos décadas, se han desarrollado técnicas experimentales para determinar estas estructuras, siendo la técnica Hi-C una de las más utilizadas. Sin embargo, este método puede requerir hasta una semana para generar datos de un solo tipo celular. Para superar estas limitaciones, el equipo del MIT ha diseñado un modelo que aprovecha los avances recientes en inteligencia artificial generativa, permitiendo predecir estructuras cromatinas en células individuales de manera rápida y precisa.
El modelo, denominado ChromoGen, consta de dos componentes: un modelo de aprendizaje profundo que analiza secuencias de ADN y datos de accesibilidad de la cromatina, y un modelo generativo que predice conformaciones cromatinas físicamente precisas, habiendo sido entrenado con más de 11 millones de conformaciones obtenidas a partir de experimentos previos. Esta combinación permite que el modelo no solo reconozca patrones en secuencias de ADN, sino que también genere múltiples estructuras posibles para cada secuencia analizada, reflejando la diversidad inherente de las configuraciones cromatinas.
Una vez entrenado, ChromoGen puede generar predicciones a una velocidad significativamente superior a la de los métodos experimentales convencionales. Según los investigadores, mientras que los experimentos tradicionales pueden tardar meses en producir unas pocas decenas de estructuras, su modelo es capaz de generar miles de estructuras en menos de 20 minutos utilizando un solo procesador gráfico.
Los autores del estudio han comparado las estructuras generadas por ChromoGen con datos experimentales y han encontrado que son idénticas o muy similares. Además, el modelo ha demostrado su capacidad para realizar predicciones precisas sobre datos de tipos celulares diferentes a los utilizados en su entrenamiento, lo que indica su potencial para analizar cómo las estructuras de la cromatina varían entre diferentes tipos de células y cómo estas diferencias impactan en sus funciones.
Este avance abre la puerta a numerosas aplicaciones, desde la exploración de estados cromatínicos dentro de una única célula hasta el estudio de mutaciones en secuencias de ADN y su relación con diversas enfermedades. Con el acceso abierto a sus datos y al modelo, los investigadores esperan que otros científicos puedan aprovechar esta herramienta para abordar cuestiones relevantes en el ámbito de la biología celular y la genética.