Una razón por la que es tan difícil producir vacunas eficaces contra algunos virus, como la gripe y el VIH, es que mutan muy rápidamente, lo que les permite evadir los anticuerpos generados por una vacuna en particular, a través de un proceso conocido como "escape viral". Los investigadores del Instituto Tecnológico de Massachusetts (MIT) han ideado ahora una nueva forma de modelar computacionalmente ese escape del sistema inmunológico basándose en modelos que fueron desarrollados para analizar el lenguaje.
El modelo puede predecir qué secciones de las proteínas de la superficie viral tienen más probabilidades de mutar de una manera que permita el escape viral, y también puede identificar secciones que tienen menos probabilidades de mutar, lo que las convierte en buenos objetivos para nuevas vacunas, según una investigación que publican sus autores en la revista 'Science'.
"La fuga viral es un gran problema --explica Bonnie Berger, profesora de matemáticas de Simons y directora del grupo de Computación y Biología en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT--. El escape viral de la proteína de superficie de la influenza y la proteína de la superficie de la envoltura del VIH son ambos muy responsables del hecho de que no tenemos una vacuna universal contra la gripe, ni tenemos una vacuna para el VIH, los cuales causan cientos de miles de muertes al año".
En el estudio, Berger y sus colegas identificaron posibles objetivos para las vacunas contra la gripe, el VIH y el SARS-CoV-2. Desde que ese artículo fue aceptado para su publicación, los investigadores también han aplicado su modelo a las nuevas variantes de SARS-CoV-2 que surgieron recientemente en el Reino Unido y Sudáfrica. Ese análisis, que aún no ha sido revisado por pares, señaló las secuencias genéticas virales que deberían investigarse más a fondo por su potencial para escapar de las vacunas existentes, dicen los investigadores.
Berger y Bryan Bryson, profesor asistente de ingeniería biológica en el MIT y miembro del Instituto Ragon de MGH, MIT y Harvard, son los autores principales del artículo, y el autor principal es el estudiante graduado del MIT Brian Hie.
Los diferentes tipos de virus adquieren mutaciones genéticas a diferentes velocidades, y el VIH y la influenza se encuentran entre los que mutan más rápido. Para que estas mutaciones promuevan el escape viral, deben ayudar al virus a cambiar la forma de las proteínas de su superficie para que los anticuerpos ya no puedan unirse a ellas. Sin embargo, la proteína no puede cambiar de una manera que la haga no funcional.
El equipo del MIT decidió modelar estos criterios utilizando un tipo de modelo computacional conocido como modelo de lenguaje, del campo del procesamiento del lenguaje natural (NLP). Estos modelos fueron diseñados originalmente para analizar patrones en el lenguaje, específicamente, la frecuencia con la que ciertas palabras ocurren juntas.
Luego, los modelos pueden hacer predicciones de qué palabras se podrían usar para completar una oración como "Sally comió huevos por ..." La palabra elegida debe ser gramaticalmente correcta y tener el significado correcto. En este ejemplo, un modelo de PNL podría predecir "desayuno" o "almuerzo".
La idea clave de los investigadores fue que este tipo de modelo también podría aplicarse a información biológica, como secuencias genéticas. En ese caso, la gramática es análoga a las reglas que determinan si la proteína codificada por una secuencia particular es funcional o no, y el significado semántico es análogo a si la proteína puede adoptar una nueva forma que le ayude a evadir anticuerpos. Por lo tanto, una mutación que permite el escape viral debe mantener la gramaticalidad de la secuencia pero cambiar la estructura de la proteína de una manera útil.
"Si un virus quiere escapar del sistema inmunológico humano no quiere mutar para morir o no puede replicarse --dice Hie--. Quiere preservar el estado físico, pero se disfraza lo suficiente como para que el sistema inmunológico humano no lo detecte".
Para modelar este proceso, los investigadores entrenaron un modelo de PNL para analizar patrones encontrados en secuencias genéticas, lo que le permite predecir nuevas secuencias que tienen nuevas funciones pero siguen las reglas biológicas de la estructura de las proteínas.
Una ventaja significativa de este tipo de modelado es que solo requiere información de secuencia, que es mucho más fácil de obtener que las estructuras de proteínas. El modelo se puede entrenar con una cantidad relativamente pequeña de información; en este estudio, los investigadores utilizaron 60.000 secuencias de VIH, 45.000 secuencias de gripe y 4.000 secuencias de coronavirus.
"Los modelos de lenguaje son muy poderosos porque pueden aprender esta compleja estructura de distribución y obtener información sobre la función simplemente a partir de la variación de secuencia --destaca Hie--. Tenemos este gran corpus de datos de secuencias virales para cada posición de aminoácidos, y el modelo aprende estas propiedades de co-ocurrencia y co-variación de aminoácidos en los datos de entrenamiento".
Una vez que se entrenó el modelo, los investigadores lo usaron para predecir secuencias de la proteína de pico de coronavirus, la proteína de la envoltura del VIH y la proteína de hemaglutinina (HA) de la influenza que serían más o menos propensas a generar mutaciones de escape.
Para la gripe, el modelo reveló que las secuencias con menos probabilidades de mutar y producir un escape viral estaban en el tallo de la proteína HA. Esto concuerda con estudios recientes que muestran que los anticuerpos que se dirigen al tallo de HA (que la mayoría de las personas infectadas con la gripe o vacunadas contra ella no desarrollan) pueden ofrecer una protección casi universal contra cualquier cepa de la gripe.
El análisis del modelo de coronavirus sugirió que una parte de la proteína de pico llamada subunidad S2 tiene menos probabilidades de generar mutaciones de escape. La pregunta sigue siendo qué tan rápido muta el virus SARS-CoV-2, por lo que se desconoce cuánto tiempo seguirán siendo efectivas las vacunas que ahora se implementan para combatir la pandemia de Covid-19.
La evidencia inicial sugiere que el virus no muta tan rápidamente como la gripe o el VIH. Sin embargo, los investigadores identificaron recientemente nuevas mutaciones que han aparecido en Singapur, Sudáfrica y Malasia, que creen que deberían investigarse para detectar un posible escape viral.
En sus estudios del VIH, los investigadores encontraron que la región hipervariable V1-V2 de la proteína tiene muchas mutaciones de escape posibles, lo cual es consistente con hallazgos anteriores, y también encontraron secuencias que tendrían una menor probabilidad de escape.
Los investigadores ahora están trabajando con otros para usar su modelo a fin de identificar posibles objetivos para las vacunas contra el cáncer que estimulan el propio sistema inmunológico del cuerpo para destruir tumores. Dicen que también podría usarse para diseñar medicamentos de moléculas pequeñas que podrían ser menos propensos a provocar resistencia, para enfermedades como la tuberculosis.
"Hay tantas oportunidades, y lo hermoso es que todo lo que necesitamos son datos de secuencia, que son fáciles de producir", resalta Bryson.