Un equipo de investigadoras españolas ha dado un paso revolucionario en la biología molecular con el desarrollo de FANTASIA, una herramienta basada en inteligencia artificial que permite predecir funciones desconocidas de cualquier proteína en cuestión de horas.

Este avance, impulsado por el Instituto de Biología Evolutiva (IBE-CSIC-UPF) y el Centro Andaluz de Biología del Desarrollo (CABD-CSIC-UPO), promete transformar la forma en que se investiga el llamado proteoma oscuro, el conjunto de proteínas cuya función aún es un misterio.

El proyecto, liderado por Rosa Fernández y Ana Rojas, ha permitido analizar cerca de 1000 genomas animales con una precisión cercana al 100%, asignando funciones a más de 24 millones de genes codificantes de proteínas.

Su impacto ya se extiende a equipos de investigación de todo el mundo, que utilizan FANTASIA para acelerar el descubrimiento científico y abrir nuevas vías en la medicina, la biotecnología y la conservación de la biodiversidad.

¿Cómo funciona la nueva herramienta?

FANTASIA -acrónimo de Functional Annotation based on embedding space Similarity- es una herramienta abierta y gratuita que utiliza inteligencia artificial para descubrir funciones ocultas de proteínas sin necesidad de entrenamiento previo.

A diferencia de los métodos tradicionales, que dependen de comparaciones con genes homólogos, esta plataforma puede interpretar el comportamiento de proteínas sin referencias conocidas, incluso en especies cuyo genoma aún no ha sido completamente descrito.

Gracias a su capacidad de procesar grandes volúmenes de datos (Big Data), FANTASIA puede analizar un genoma completo en horas desde un ordenador convencional o en tan solo 30 minutos utilizando un equipo especializado, lo que supone un salto cualitativo en la eficiencia de la investigación genética.

¿Cómo fue elaborado el estudio?

El desarrollo de FANTASIA es el resultado de una colaboración multidisciplinar entre los equipos del Instituto de Biología Evolutiva (IBE) y el Centro Andaluz de Biología del Desarrollo (CABD).

Los investigadores aplicaron la herramienta al análisis de miles de ejemplos conocidos de proteínas, generando representaciones matemáticas llamadas vectores numéricos, que actúan como una huella digital de cada una.

A partir de estos vectores, el sistema identifica patrones, procesos biológicos asociados y la localización celular de cada proteína. De esta forma, puede predecir con alta precisión la función de nuevas secuencias genéticas, incluso en organismos poco estudiados. Por su versatilidad, algunos científicos la describen como un verdadero "ChatGPT de las proteínas“.

¿Qué revela este hallazgo?

El uso de FANTASIA ha permitido descubrir funciones ocultas en proteínas de organismos poco conocidos, como los tardígrados, ctenóforos y micrognatozoos, tres filos invertebrados cuyo estudio aún presenta grandes lagunas.

Estos hallazgos no solo contribuyen a comprender la evolución y la diversidad biológica, sino que también abren nuevas oportunidades en el desarrollo farmacéutico, al facilitar la identificación de posibles dianas terapéuticas.

Según Rosa Fernández, comprender la función de estos genes “abre una nueva ventana al conocimiento de la biología animal” y permitirá entender “cómo surgen las innovaciones evolutivas y qué papel desempeñan las proteínas desconocidas en la adaptación de las especies”. El potencial de esta herramienta, concluye la investigadora, “no tiene límite” y podría revolucionar la biotecnología, la medicina y la conservación del planeta.