¡Bienvenidos! En esta publicación, analizaremos carácter por carácter el código fuente de la vacuna de ARNm del SARS-CoV-2 de BioNTech / Pfizer.
Ahora, estas palabras pueden resultar algo discordantes: la vacuna es un líquido que se inyecta en el brazo. ¿Cómo podemos hablar de código fuente? (como en las computadoras)
Esta es una buena pregunta, así que comencemos con una pequeña parte del mismo código fuente de la vacuna BioNTech / Pfizer, también conocida como BNT162b2, también conocida como Tozinameran también conocida como Comirnaty.
Primeros 500 caracteres del ARNm de BNT162b2. Fuente: Organización Mundial de la Salud.
La vacuna de ARNm BNT162b tiene este código digital en su corazón. Tiene 4284 caracteres, por lo que cabría en un montón de tweets. Al comienzo del proceso de producción de la vacuna, alguien cargó este código en una impresora de ADN (sí), que luego convirtió los bytes en el disco en moléculas de ADN reales.
De esta máquina aquí salen pequeñas cantidades de ADN, que después de mucho procesamiento biológico y químico terminan como ARN (más sobre esto más adelante) en el vial de la vacuna. Una dosis de 30 micro gramos en realidad contiene 30 micro gramos de ARN. Además, existe un inteligente sistema de empaquetado de lípidos (grasos) que lleva el ARNm a nuestras células.
El ARN es la versión volátil de “memoria de trabajo” del ADN. El ADN es como el almacenamiento en memoria USB de la biología. El ADN es muy duradero, internamente redundante y muy confiable. Pero al igual que las computadoras no ejecutan código directamente desde una unidad flash, antes de que suceda algo, el código se copia en un sistema más rápido, más versátil pero mucho más frágil.
Para las computadoras, esto es RAM, para biología es ARN. El parecido es sorprendente. A diferencia de la memoria flash, la RAM se degrada muy rápidamente a menos que se la atienda con cariño. La razón por la que la vacuna de ARNm de Pfizer / BioNTech debe almacenarse en el congelador más profundo es la misma: el ARN es una flor frágil.
Cada carácter de ARN pesa del orden de 0,53 · 10⁻²¹ gramos, lo que significa que hay 6 · 10¹⁶ caracteres en una sola dosis de vacuna de 30 micro gramos. Expresado en bytes, esto es alrededor de 25 petabytes, aunque hay que decir que consta de alrededor de 2000 mil millones de repeticiones de los mismos 4284 caracteres. El contenido informativo real de la vacuna es de poco más de un kilobyte. El propio SARS-CoV-2 pesa alrededor de 7,5 kilobytes.
El más breve trasfondo
El ADN es un código digital. A diferencia de las computadoras, que usan 0 y 1, la vida usa A, C, G y U / T (los “nucleótidos”, “nucleósidos” o “bases”).
En las computadoras almacenamos el 0 y el 1 como la presencia o ausencia de una carga, o como una corriente, como una transición magnética, o como un voltaje, o como una modulación de una señal, o como un cambio en la reflectividad. O, en resumen, el 0 y el 1 no son una especie de concepto abstracto: viven como electrones y en muchas otras encarnaciones físicas.
En la naturaleza, A, C, G y U / T son moléculas, almacenadas como cadenas en el ADN (o ARN).
En las computadoras, agrupamos 8 bits en un byte, y el byte es la unidad típica de datos que se procesan.
La naturaleza agrupa 3 nucleótidos en un codón, y este codón es la unidad típica de procesamiento. Un codón contiene 6 bits de información (2 bits por carácter de ADN, 3 caracteres = 6 bits. Esto significa 2⁶ = 64 valores de codón diferentes).
Bastante digital hasta ahora. En caso de duda, consulte el documento de la OMS con el código digital para comprobarlo usted mismo.
Entonces, ¿qué hace el código?
La idea de una vacuna es enseñarle a nuestro sistema inmunológico cómo combatir un patógeno, sin que realmente nos enfermemos. Históricamente, esto se ha hecho inyectando un virus debilitado o incapacitado (atenuado), más un “adyuvante” para asustar a nuestro sistema inmunológico y ponerlo en acción. Esta era una técnica decididamente análoga que involucraba miles de millones de huevos (o insectos). También requirió mucha suerte y mucho tiempo. A veces, también se utilizó un virus diferente (no relacionado).
Una vacuna de ARNm logra lo mismo (“educar a nuestro sistema inmunológico”) pero de una manera similar al láser. Y lo digo en ambos sentidos: muy estrecho pero también muy poderoso.
Pues así es como funciona. La inyección contiene material genético volátil que describe la famosa proteína “Spike” del SARS-CoV-2. Mediante ingeniosos medios químicos, la vacuna logra introducir este material genético en algunas de nuestras células.
Estos luego, diligentemente, comienzan a producir proteínas de pico de SARS-CoV-2 en cantidades lo suficientemente grandes como para que nuestro sistema inmunológico entre en acción. Frente a las proteínas Spike y (lo que es más importante) los signos reveladores de que las células se han apoderado, nuestro sistema inmunológico desarrolla una respuesta poderosa contra múltiples aspectos de la proteína Spike Y el proceso de producción.
Y esto es lo que nos lleva a la vacuna con una eficacia del 95%.
¡El código fuente!
Esta es una especie de tabla de contenido. Comenzaremos con la “Gorra”, en realidad representada como un pequeño sombrero.
Al igual que no puede simplemente introducir códigos de operación en un archivo en una computadora y ejecutarlo, el sistema operativo biológico requiere encabezados, tiene vinculadores y cosas como convenciones de llamadas.
El código de la vacuna comienza con los siguientes dos nucleótidos:
GA
Esto se puede comparar mucho con todos los ejecutables de DOS y Windows que comienzan con MZ, o con los scripts de UNIX que comienzan con # !. Tanto en la vida como en los sistemas operativos, estos dos personajes no se ejecutan de ninguna manera. Pero tienen que estar ahí porque de lo contrario no pasa nada.
La “tapa” de ARNm tiene varias funciones. Por un lado, marca el código como proveniente del núcleo. En nuestro caso, por supuesto que no, nuestro código proviene de una vacuna. Pero no necesitamos decirle eso al celular. El límite hace que nuestro código parezca legítimo, lo que lo protege de la destrucción.
Los dos nucleótidos GA iniciales también son químicamente ligeramente diferentes del resto del ARN. En este sentido, el GA tiene alguna señalización fuera de banda.
La “región sin traducir de cinco primos”
Algo de jerga aquí. Las moléculas de ARN solo se pueden leer en una dirección. De manera confusa, la parte donde comienza la lectura se llama 5 ‘o’ cinco primos ‘. La lectura se detiene en el extremo 3 ‘o tres primos.
La vida consiste en proteínas (o cosas hechas por proteínas). Y estas proteínas se describen en ARN. Cuando el ARN se convierte en proteínas, esto se llama traducción.
Aquí tenemos la región no traducida de 5 ‘(“UTR”), por lo que este bit no termina en la proteína:
GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC
Aquí encontramos nuestra primera sorpresa. Los caracteres normales de ARN son A, C, G y U. U también se conoce como “T” en el ADN. Pero aquí encontramos un Ψ, ¿qué está pasando?
Este es uno de los aspectos excepcionalmente inteligentes de la vacuna. Nuestro cuerpo ejecuta un potente sistema antivirus (“el original”). Por esta razón, las células son extremadamente poco entusiastas con el ARN extraño y se esfuerzan mucho por destruirlo antes de que haga algo.
Esto es un problema para nuestra vacuna: debe escabullirse de nuestro sistema inmunológico. Durante muchos años de experimentación, se descubrió que si la U en el ARN es reemplazada por una molécula ligeramente modificada, nuestro sistema inmunológico pierde interés. De verdad.
Entonces, en la vacuna BioNTech / Pfizer, cada U ha sido reemplazada por 1-metil-3′-pseudouridililo, denotado por Ψ. Lo realmente inteligente es que, aunque este reemplazo Ψ aplaca (calma) nuestro sistema inmunológico, es aceptado como una U normal por partes relevantes de la célula.
En seguridad informática también conocemos este truco: a veces es posible transmitir una versión ligeramente dañada de un mensaje que confunde los firewalls y las soluciones de seguridad, pero que aún así es aceptado por los servidores backend, que luego pueden ser pirateados.
Ahora estamos cosechando los beneficios de la investigación científica fundamental realizada en el pasado. Los descubridores de esta Ψ técnica tuvieron que luchar para conseguir financiar su trabajo y luego aceptaron. Todos deberíamos estar muy agradecidos y estoy seguro de que los premios Nobel llegarán a su debido tiempo.
Mucha gente se ha preguntado si los virus también podrían utilizar la técnica Ψ para vencer a nuestro sistema inmunológico. En resumen, esto es extremadamente improbable. La vida simplemente no tiene la maquinaria para construir nucleótidos de 1-metil-3′-pseudouridililo. Los virus dependen de la maquinaria de la vida para reproducirse, y esta facilidad simplemente no existe. Las vacunas de ARNm se degradan rápidamente en el cuerpo humano y no hay posibilidad de que el ARN modificado en Ψ se replique con el Ψ todavía allí. “No, realmente, las vacunas de ARNm no afectarán tu ADN” también es una buena lectura.
Ok, volvamos a la UTR de 5 ‘. ¿Qué hacen estos 51 personajes? Como todo en la naturaleza, casi nada tiene una función clara.
Cuando nuestras células necesitan traducir ARN en proteínas, esto se hace utilizando una máquina llamada ribosoma. El ribosoma es como una impresora 3D de proteínas. Ingiere una cadena de ARN y, en base a eso, emite una cadena de aminoácidos, que luego se pliegan en una proteína.
Fuente : Wikipedia user Bensaccount
Esto es lo que vemos que sucede arriba. La cinta negra en la parte inferior es ARN. La cinta que aparece en la parte verde es la proteína que se está formando. Las cosas que entran y salen son aminoácidos más adaptadores para que encajen en el ARN.
Este ribosoma necesita asentarse físicamente en la hebra de ARN para que funcione. Una vez sentado, puede comenzar a formar proteínas basadas en más ARN que ingiere. A partir de esto, puedes imaginar que todavía no puede leer las partes donde aterriza primero. Esta es solo una de las funciones de la UTR: la zona de aterrizaje del ribosoma. El UTR proporciona “introducción”.
Además de esto, la UTR también contiene metadatos: ¿cuándo debe realizarse la traducción? ¿Y cuánto? Para la vacuna, tomaron la mayor cantidad de UTR “ahora mismo” que pudieron encontrar, extraída del gen de la alfa globina. Se sabe que este gen produce de forma robusta muchas proteínas. En años anteriores, los científicos ya habían encontrado formas de optimizar aún más esta UTR (según el documento de la OMS), por lo que esta no es exactamente la UTR de alfa globina. Es mejor.
El péptido señal de la glicoproteína S
Como se señaló, el objetivo de la vacuna es lograr que la célula produzca grandes cantidades de la proteína Spike del SARS-CoV-2. Hasta este punto, hemos encontrado principalmente metadatos y cosas de “convenciones de llamada” en el código fuente de la vacuna. Pero ahora entramos en el territorio real de las proteínas virales.
Sin embargo, todavía nos queda una capa de metadatos. Una vez que el ribosoma (de la espléndida animación anterior) ha producido una proteína, esa proteína todavía necesita ir a alguna parte. Este está codificado en el “péptido señal de la glicoproteína S (secuencia líder extendida)”.
La forma de ver esto es que al comienzo de la proteína hay una especie de etiqueta de dirección, codificada como parte de la proteína misma. En este caso específico, el péptido señal dice que esta proteína debe salir de la célula a través del “retículo endoplásmico”. ¡Incluso la jerga de Star Trek no es tan elegante como esta!
El “péptido señal” no es muy largo, pero cuando miramos el código, hay diferencias entre el ARN viral y de la vacuna:
(Tenga en cuenta que para fines de comparación, he reemplazado el elegante modificado Ψ por un ARN U normal)
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 Virus: AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU Vacuna: AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUU ! ! ! ! ! ! ! ! ! ! ! ! !
¿Entonces qué está pasando? No he incluido accidentalmente el ARN en grupos de 3 letras. Tres caracteres de ARN forman un codón. Y cada codón codifica un aminoácido específico. El péptido señal de la vacuna consta exactamente de los mismos aminoácidos que el propio virus.
Entonces, ¿cómo es que el ARN es diferente?
Hay 4³ = 64 codones diferentes, ya que hay 4 caracteres de ARN, y hay tres de ellos en un codón. Sin embargo, solo hay 20 aminoácidos diferentes. Esto significa que múltiples codones codifican el mismo aminoácido.
La vida misma utiliza la siguiente tabla casi universal para mapear codones de ARN en aminoácidos:
fuente de la tabla (wikipedia)
En esta tabla, podemos ver que las modificaciones en la vacuna (UUU -> UUC) son todas sinónimos. El código de ARN de la vacuna es diferente, pero salen los mismos aminoácidos y la misma proteína.
Si miramos de cerca, vemos que la mayoría de los cambios ocurren en la posición del tercer codón, señalado con un “3” arriba. Y si comprobamos la tabla de codones universales, vemos que esta tercera posición, de hecho, a menudo no importa para qué aminoácido se produce.
Entonces, los cambios son sinónimos, pero ¿por qué están ahí? Mirando de cerca, vemos que todos los cambios excepto uno conducen a más C y Gs.
Entonces, ¿por qué harías eso? Como se señaló anteriormente, nuestro sistema inmunológico ve muy mal el ARN “exógeno”, el código de ARN que proviene del exterior de la célula. Para evadir la detección, la “U” en el ARN ya fue reemplazada por una Ψ.
Sin embargo, resulta que el ARN con una mayor cantidad de Gs y Cs también se convierte de manera más eficiente en proteínas,
Y esto se ha logrado en el ARN de la vacuna reemplazando muchos caracteres con Gs y Cs siempre que fue posible.
La proteína Spike real
Los siguientes 3777 caracteres del ARN de la vacuna están igualmente “optimizados por codones” para agregar muchas C y G. En aras del espacio, no enumeraré todo el código aquí, pero vamos a acercarnos a una parte excepcionalmente especial. Esta es la parte que lo hace funcionar, la parte que realmente nos ayudará a volver a la vida normal:
* * L D K V E A E V Q I D R L I T G Virus: CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC Vacuna: CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC L D P P E A E V Q I D R L I T G ! !!! !! ! ! ! ! ! ! !
Aquí vemos los cambios habituales de ARN. Por ejemplo, en el primer codón vemos que CUU se cambia a CUG. Esto agrega otra “G” a la vacuna, que sabemos que ayuda a mejorar la producción de proteínas. Tanto CUU como CUG codifican el aminoácido “L” o leucina, por lo que nada cambió en la proteína.
Cuando comparamos toda la proteína Spike en la vacuna, todos los cambios son sinónimos así … excepto dos, y esto es lo que vemos aquí.
Los codones tercero y cuarto anteriores representan cambios reales. Los aminoácidos K y V se reemplazan por “P” o Prolina. Para “K” esto requirió tres cambios (“!!!”) y para “V” requirió solo dos (“!!”).
Resulta que estos dos cambios mejoran enormemente la eficacia de la vacuna.
Entonces, ¿Que esta pasando aquí? Si observa una partícula real de SARS-CoV-2, puede ver la proteína Spike y, bueno, un montón de picos:
Los picos están montados en el cuerpo del virus (“la proteína de la nucleocápsida”). Pero la cuestión es que nuestra vacuna solo genera los picos en sí misma y no los estamos montando en ningún tipo de cuerpo del virus.
Resulta que, las proteínas Spike independientes y no modificadas colapsan en una estructura diferente. Si se inyecta como vacuna, esto de hecho haría que nuestros cuerpos desarrollen inmunidad … pero solo contra la proteína de pico colapsada.
Y el verdadero SARS-CoV-2 aparece con el pico puntiagudo. La vacuna no funcionaría muy bien en ese caso.
¿Entonces lo que hay que hacer? En 2017, se describió cómo colocar una doble sustitución de Prolina en el lugar correcto haría que las proteínas SARS-CoV-1 y MERS S adoptaran su configuración de “pre-fusión”, incluso sin ser parte del virus completo. Esto funciona porque la prolina es un aminoácido muy rígido. Actúa como una especie de férula, estabilizando la proteína en el estado que necesitamos mostrarle al sistema inmunológico.
La gente que descubrió esto debería estar chocandose las manos sin cesar. Deberían emanar de ellos cantidades insoportables de presunción. Y todo sería bien merecido.
El final de la proteína, próximos pasos
Si nos desplazamos por el resto del código fuente, encontramos algunas pequeñas modificaciones al final de la proteína Spike:
V L K G V K L H Y T s Virus: GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA Vacuna: GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA V L K G V K L H Y T s s ! ! ! ! ! ! ! !
Al final de una proteína encontramos un codón de “parada”, denotado aquí por una “s” minúscula. Esta es una forma educada de decir que la proteína debería terminar aquí. El virus original usa el codón de terminación UAA, la vacuna usa dos codones de terminación UGA, quizás solo por si acaso.
La región 3 ‘sin traducir
Al igual que el ribosoma necesitaba un poco de introducción en el extremo 5 ‘, donde encontramos la “región no traducida de cinco primos”, al final de una región codificante de proteínas encontramos una construcción similar llamada UTR 3’.
Se podrían escribir muchas palabras sobre el 3 ‘UTR, pero aquí cito lo que dice la Wikipedia: “La región 3′ sin traducir juega un papel crucial en la expresión génica al influir en la localización, estabilidad, exportación y eficiencia de traducción de un ARNm. . A pesar de nuestra comprensión actual de las 3′-UTR, siguen siendo misterios relativos ”.
Lo que sí sabemos es que ciertas 3′-UTR tienen mucho éxito en promover la expresión de proteínas. Según el documento de la OMS, la vacuna 3′-UTR de BioNTech / Pfizer se seleccionó del “potenciador amino-terminal del ARNm dividido (AES) y el ARN ribosómico 12S codificado mitocondrial para conferir estabilidad al ARN y una alta expresión de proteína total”. A lo que digo, bien hecho.
El AAAAAAAAAAAAAAAAAAAAAA final de todo
El mismo final del ARNm está poliadenilado. Esta es una forma elegante de decir que termina en una gran cantidad de AAAAAAAAAAAAAAAAAA. Parece que incluso el ARNm ha tenido suficiente del 2020.
El ARNm se puede reutilizar muchas veces, pero cuando esto sucede, también pierde algunas de las A al final. Una vez que se agotan las A, el ARNm ya no es funcional y se descarta. De esta manera, la cola “poli-A” protege contra la degradación.
Se han realizado estudios para averiguar cuál es el número óptimo de A al final para las vacunas de ARNm. Leí en la literatura abierta que esto alcanzó un máximo de 120 más o menos.
La vacuna BNT162b2 termina con:
****** **** UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
Se trata de 30 A, luego un “enlazador de 10 nucleótidos” (GCAUAUGACU), seguido de otros 70 A.
Sospecho que lo que vemos aquí es el resultado de una mayor optimización patentada para mejorar aún más la expresión de proteínas.
Resumiendo
Con esto, ahora conocemos el contenido exacto de ARNm de la vacuna BNT162b2 y, en la mayoría de los casos, entendemos por qué están ahí:
- El CAP para asegurarse de que el ARN se vea como un ARNm normal
- Una región no traducida (UTR) de 5 ‘optimizada y exitosa conocida
- Un péptido señal de codón optimizado para enviar la proteína Spike al lugar correcto (copiado al 100% del virus original)
- Una versión optimizada de codones del pico original, con dos sustituciones de “Prolina” para asegurarse de que la proteína aparezca en la forma correcta.
- Una región no traducida de 3 ‘conocida exitosa y optimizada
- Una cola poli-A ligeramente misteriosa con un “enlazador” inexplicable allí
La optimización de codones agrega mucho G y C al ARNm. Mientras tanto, el uso de Ψ (1-metil-3′-pseudouridilil) en lugar de U ayuda a evadir nuestro sistema inmunológico, por lo que el ARNm permanece el tiempo suficiente para que podamos ayudar a entrenar el sistema inmunológico.
Fuentes:
https://www.fda.gov/media/144325/download
https://en.wikipedia.org/wiki/Tozinameran
https://mednet-communities.net/inn/db/media/docs/11889.doc
https://en.wikipedia.org/wiki/DOS_MZ_executable
https://en.wikipedia.org/wiki/Five-prime_cap#Function
https://www.tandfonline.com/doi/full/10.1080/15476286.2018.1450054
https://www.nature.com/articles/nrd.2017.243
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1463026/
Leave A Comment
You must be logged in to post a comment.