Actualidad Cientifica

Revista 618

La Inteligencia artificial en el laboratorio de Microbiología

Obtienen con IA el mapa más completo de interacciones para la supervivencia de las bacterias. Una investigación de bioquímicos españoles describe cómo se combinan e interactúan las proteínas para realizar funciones esenciales para su supervivencia. Un conocimiento clave para el desarrollo de nuevos antibióticos.

Por Ana Pertierra

Las bacterias llevan a cabo muchas funciones que son clave para su supervivencia, como la producción de la energía que necesitan, la replicación del ADN y la división celular para reproducirse, o la síntesis de la membrana celular para protegerse e interactuar con el entorno, entre otras. En todos estos procesos intervienen complejos que requieren una acción coordinada de un conjunto de proteínas que son esenciales: sin ellas los procesos no se desarrollan y la bacteria muere. Por eso, conocer en detalle cómo se regulan estos procesos básicos, qué proteínas intervienen en ellos y cómo interactúan es fundamental para comprender los mecanismos de crecimiento, reproducción y supervivencia de las bacterias.

Las técnicas experimentales utilizadas hasta ahora han permitido identificar millones de interacciones entre proteínas y miles de estructuras de estas, pero son datos en bruto que dan un número muy grande de falsos positivos, de interacciones que, en realidad, no tienen ningún valor.

Con los modelos de inteligencia artificial (IA) desarrollados recientemente, como AlphaFold2, se ha podido obtener estructuras de proteínas con una precisión similar a los métodos experimentales, diferenciando entre interacciones genuinas entre proteínas e interacciones falsas.

Profesor Marc Torrent del Departamento de Bioquímica y Biología Molecular de la Universidad Autónoma de Barcelona

Así, investigadores del Departamento de Bioquímica y de Biología Molecular de la Universitat Autònoma de Barcelona (UAB) han empleado AlphaFold2 para predecir el conjunto de interacciones entre proteínas que son principales para la supervivencia de las bacterias, un total de 1.402 posibles interacciones que conforman el mapa más completo de lo que se llama interactoma esencial de las bacterias.

Todas estas interacciones amplían los conocimientos sobre los mecanismos de acción que necesitan las bacterias para sobrevivir y permiten identificar qué interacciones entre proteínas pueden ser dianas para el desarrollo de nuevos antibióticos.

FABAinforma se comunicó en el profesor de la UAB, Marc Torrent, director de la investigación, quien explicó que han logrado caracterizar estructuralmente, mediante las nuevas herramientas de la inteligencia artificial, las interacciones esenciales entre proteínas que les permiten a las bacterias vivir y multiplicarse. Según el investigador español, este aporte de nuevo conocimiento será significativo para el desarrollo de nuevos antibióticos.

¿Qué nuevo conocimiento aporta este estudio a los mecanismos de los procesos biológicos en bacterias?

Los complejos proteína-proteína son esenciales en las células bacterianas, involucrados en procesos vitales como la transcripción génica, replicación del ADN y señalización celular, asegurando la coordinación precisa de las funciones celulares. Muchas de estas estructuras tridimensionales son desconocidas, dificultando el estudio de su mecanismo de acción. En nuestro estudio, hemos predicho las estructuras de cientos de complejos previamente desconocidos, permitiéndonos hipotetizar cómo ocurren algunas de estas reacciones a nivel molecular.

¿A qué se denominan interactomas esenciales?

En la célula, las proteínas muchas veces no actúan de forma individual, sino que interactúan físicamente entre sí. Al conjunto completo de interacciones moleculares que ocurren entre proteínas (o biomoléculas en general) en un sistema biológico específico lo llamamos interactoma. En nuestro estudio, describimos el interactoma esencial, es decir, aquel que contiene solo las interacciones necesarias para el correcto funcionamiento de la célula bacteriana. Si, por algún motivo, alguna de estas interacciones no se produce, la célula dejaría de ser viable.

¿Cuáles son las ventajas de la inteligencia artificial y las tecnologías de aprendizaje profundo aplicadas a la investigación de la Biología molecular de las bacterias?

Las ventajas que presenta la IA en la Bioquímica y Biología Molecular son muchas, pero centraría el impacto en tres ejes principales. El primero es la capacidad de analizar grandes cantidades de datos de forma eficiente para extraer patrones y relaciones complejas. De hecho, la IA no es solo capaz de analizar datos, sino que permite generar nuevos elementos que la naturaleza aún no ha explorado. Esta IA generativa, nos permite, por ejemplo, diseñar nuevas secuencias y estructuras de proteínas con funciones nuevas. El segundo eje principal es la capacidad de realizar predicciones con un alto grado de precisión, como la predicción de estructuras tridimensionales de proteínas. Una de las ventajas de AlphaFold, por ejemplo, no es solo la elevada capacidad de precisión, sino que nos indica en qué partes de la estructura la predicción es más fiable y en qué grado. Finalmente, el tercer eje pivota alrededor de la capacidad que nos proporciona la IA para obtener resultados en poco tiempo, una característica que comparte con otras metodologías de la Biología Computacional. Con estas herramientas, podemos simular en el ordenador multitud de procesos que tardaríamos años en analizar en el laboratorio. Algunos experimentos serían literalmente inviables.

Marc Torrent junto a su equipo de investigación de la UAB

¿Con qué bases de datos trabajaron?

Fundamentalmente trabajamos con STRING, una base de datos con millones de interacciones proteicas. En este trabajo cruzamos STRING con otras bases de datos como DEG, que contiene información sobre las proteínas esenciales en diversos microorganismos, para generar un primer mapa del interactoma, que luego refinamos a través de IA, utilizando AlphaFold.

¿Por qué ustedes señalan que este tipo de estudios pueden colaborar para descubrir nuevos antibióticos?

La estructura tridimensional de las proteínas y complejos proteicos es una información esencial para saber dónde y cómo pueden actuar los fármacos. En nuestro caso, si somos capaces de determinar cuáles son las interacciones esenciales de un patógeno y desarrollar moléculas que inhiban su formación, estaremos creando, de facto, nuevos antibióticos. Al predecir estructuras de proteínas no caracterizadas previamente, podemos estudiar nuevas dianas terapéuticas, lo que permite identificar nuevos fármacos. Esta información, con resolución a escala atómica, nos permitirá diseñar/optimizar fármacos de forma racional y precisa.

¿Cuáles son las limitaciones de la metodología empleada en este estudio (AF2)?

Hay varias limitaciones. Una de ellas radica en la propia definición de esencialidad. La esencialidad de una proteína depende de las condiciones en las que crece la bacteria. Por ejemplo, al crecer en entornos diferentes de salinidad, temperatura o pH, las bacterias pueden requerir proteínas distintas. La segunda limitación estriba en la flexibilidad de las proteínas. Los complejos proteicos son entidades dinámicas que sufren cambios conformacionales constantes en condiciones celulares. Sin embargo, AlphaFold nos proporciona estructuras estáticas que pueden no representar el conjunto de conformaciones posibles. Finalmente, también cabe destacar que en este estudio nos hemos limitado a interacciones binarias, es decir, entre proteínas dos a dos. Sin embargo, es posible que, para complejos proteicos grandes, formados por más de 2 proteínas, AlphaFold no sea capaz de generar modelos suficientemente precisos, ya que se requeriría de la composición del complejo total.

¿Qué diferencia esta metodología de las técnicas experimentales?

La metodología que hemos seguido para identificar las interacciones proteicas esenciales y para generar las estructuras tridimensionales es puramente computacional. Esto tiene ventajas claras, como ya hemos mencionado antes. Sin embargo, hay que tener en cuenta que los resultados obtenidos son predicciones y hay que verificarlas en el laboratorio. No obstante, la elevada precisión con la que AlphaFold es capaz de modelar los complejos proteicos, particularmente procariotas, es muy alentadora.