Uno de los mayores enigmas de la medicina actual es entender por qué ciertas proteínas se pliegan mal y forman agregados tóxicos en el cerebro. Ahora, un equipo liderado por el CONICET, el Instituto Leloir y el ITBA ha creado una herramienta de Inteligencia Artificial capaz de leer estas moléculas como si fueran oraciones, anticipando el desarrollo de patologías graves.
Comprender y predecir el plegamiento incorrecto de las proteínas es uno de los grandes desafíos de la medicina moderna, ya que estos fallos derivan en la formación de agregados tóxicos que colaboran al desarrollo de enfermedades como el Alzheimer, el Parkinson o la esclerosis lateral amiotrófica (ELA). Para enfrentar este problema, un grupo internacional liderado por especialistas argentinos ha presentado AggrescanAI, un software que supera a los sistemas informáticos estándar actuales.
Leyendo el «idioma» biológico
La gran innovación de AggrescanAI radica en su enfoque. Cristina Marino-Buslje, investigadora del CONICET y coautora del trabajo, explica que es una herramienta de aprendizaje profundo (deep learning). A diferencia de las herramientas anteriores, que analizaban a las proteínas como simples cadenas de letras aisladas, este nuevo software «lee» la proteína de la misma manera que un humano lee una oración.
El sistema entiende que el significado o comportamiento de una parte de la estructura cambia según su contexto, es decir, según lo que ocurre a su alrededor. Para lograr esto, utilizaron el modelo de lenguaje de proteínas ProtT5, una inteligencia artificial que aprende el «idioma» de las moléculas transformando cada aminoácido en un conjunto de números llamados «embeddings». Esto permite a la IA predecir propiedades biológicas y zonas de agregación sin necesidad de ver la estructura física, simplemente entendiendo su significado.
Impacto económico y sanitario
El desarrollo no solo es un hito técnico, sino que promete un impacto directo en la economía y la salud pública. Al poder predecir la agregación basándose únicamente en la secuencia de la proteína, se elimina la necesidad de realizar imágenes 3D, que son procesos costosos y lentos.
Esto permite a los investigadores probar virtualmente qué proteínas tienen tendencias peligrosas, facilitando el análisis masivo de miles de moléculas para encontrar cuáles previenen mejor la formación de estos agregados tóxicos. Además, el software puede predecir mutaciones genéticas peligrosas, ayudando a los médicos a establecer diagnósticos más rápidos y a planificar terapias personalizadas.

Ciencia abierta y gratuita
El proyecto, que contó con la colaboración de la Universidad Autónoma de Barcelona, es de acceso libre. Cualquier investigador puede acceder a AggrescanAI a través de una Google Colab notebook, donde solo es necesario ingresar la secuencia de la proteína incógnita para obtener un análisis detallado sobre sus zonas con tendencia a la agregación.
