El conglomerado estadounidense de tecnología y redes sociales Meta, desarrolló una herramienta a través de la inteligencia artificial (IA), que puede predecir la estructura de cientos de millones de proteínas.
ESMFold se dio a conocer en noviembre de 2022, cuenta con una base de datos de 617 millones de proteínas posibles de microorganismos, como bacterias y virus, que aún no se han caracterizado, lo que permitirá a los investigadores y científicos a profundizar sus investigaciones y así acelerar el descubrimiento de nuevos medicamentos.
Esta IA está basada en modelos de lenguaje que se emplea en la predicción de textos, sin embargo, ESMFold lo utiliza para autocompletar secuencias de proteínas y revelar la estructura 3D de estas.
Las secuencias de proteínas son complejas. Dependiendo de cómo se conectan los bloques de construcción individuales y se unen entre sí, una proteína desarrolla diferentes propiedades.
Debido a los muchos parámetros variables, el cálculo de las estructuras moleculares requiere mucha potencia informática y sofisticadas herramientas de IA.
En una publicación en la revista Science, Meta describe que, del total de proteínas incluidas, 225 millones se consideran “predicciones de alta confianza”.
Incluso, el documento destaca que las predicciones de ESMFold fueron completadas en solo seis días.
Un gran avance
Anteriormente, los científicos estudiaron durante décadas para predecir la estructura y la función de las proteínas, esto es complejo debido a que las mismas se vuelven a plegar constantemente antes de formar su estructura final.
Este estudio se realizaba con microscopios para mapear las moléculas a nivel atómico y sus resultados tardaban años en confirmarse, ahora gracias al empleo de la IA, las formas de proteínas se pueden predecir en horas o días.
Un factor clave de ESMFold es que utiliza una base de datos similar a la empleada por OpenAI en su ChatGPT.
Los programadores alimentaron esta herramienta con un seriado de letras que representan aminoácidos que forman el código genético de una proteína, luego ESMFold aprendió a llenar las secciones vacías u ocultas en la secuencia de proteínas.
Una vez que la secuencia estuvo completa, el programa de Meta acertó la relación entre las secuencias conocidas para predecir las estructuras de las nuevas proteínas.
La empresa tecnológica ubicada Menlo Park prevé expandir los estudios de cómo funcionan las proteínas como el componente básico de la vida y acelerar el desarrollo de nuevos medicamentos.
Con el perfeccionamiento de ESMFold, los científicos podrán predecir estructuras proteicas que podrían mejorar la efectividad de los medicamentos existentes, y ayudar a detectar moléculas que son difíciles de tratar para curar enfermedades como el cáncer, VIH, entre otros.