El ADN humano contiene entre 15 y 750 MB de información, según cómo se mida
Encontré unas cuantas disquisiciones interesantes en un artículo titulado How much information is in DNA? (¿Cuánta información hay en el ADN?) que al parecer estaba inspirado por las preguntas de otro: Mechanisms too simple for humans to design (Mecanismos demasiado simples para que los humanos los diseñen. Trata sobre un tema que hemos comentado por aquí alguna vez: cuánta información contiene el ADN humano. El TL;DR sería unos 575 MB, según el autor (Dynomight). Esta cantidad de información cabría en un CD-ROM, y es menos que lo que ocupan muchas fotografías tomadas con un smartphone. En un teléfono móvil de 256 GB «cabrían» unos 450 humanos, apretaditos como sardinas en lata. El artículo es bastante técnico y permite ampliar tu vocabulario científico con términos como retrotransposones, polimerasas, exones y centrómeros. Pero si te interesa el tema es una guía paso a paso de cómo se calcula todo. El cálculo más «tirando por lo alto» parte de que el ADN tiene unos 3.100 millones de pares de bases, cada uno de los cuales puede tener cuatro valores (A, T, C, G). Teniendo en cuenta que cada base se podría codificar con 2 bits en total, harían falta unos 6.200 millones de bits, o 775 megabytes. Calcular la cantidad de información del ADN es complicado. Para empezar, se desconoce una función clara para el 80-90 por ciento del genoma, aunque no por ello ha de ser «basura», pero ahí está el dato. Además de eso, los humanos somos diploides y tenemos dos copias de cada cromosoma (uno proviene del padre y otro de la madre) y en ellos las bases se activan y desactivan por impronta genética, mutación, silenciamiento u otras razones. ¿Habría que contar ambas o solo una? Además sucede que la información se puede comprimir, como sabe cualquiera que haya creado un archivo .ZIP o exportado un .JPEG, y hay razones para suponer que esto también es así en el ADN humano. Es una cuestión de economía y de practicidad. Pero las formas de comprimir son muy distintas y hacen variar el tamaño de la información. Por ejemplo, como los seres humanos somos todos 99,6% similares se podría usar un «genoma estándar» de referencia y almacenar las diferencias; en este caso bastarían unos 15 MB. Si se comprimieran sin ese genoma de referencia, que sería como un «ser humano básico», entonces el ahorro de espacio sería menor; la información del ADN quedaría en algo del orden más bien de unos 575 MB en total. Según el autor, si además se descartaran las versiones comprimidas que no generan «seres humanos funcionales similares» la cosa estaría entre 60 y 750 MB. Pero dice que lo más probable es que estemos ante un ADN comprimido sin referencia, aunque poco comprimido, y se queda con 575 MB como valor a medio camino. Esa sería la información que contiene nuestro ADN. Relacionado: Avances en el almacenamiento de información en moléculas de ADN The Genographic Project, ¿de dónde venimos? Nuestro ADN lo revela ADN con «marcas de agua» para identificar organismos patentados El genoma humano, grabado en cristal de 360 TB para la eternidad Genética: un secuenciador de ADN de menos de 1.000 dólares Pruebas de paternidad de ADN desde casa (un poco en plan Gattaca) ¿Qué es la información? Lo que nos deparará la secuenciación completa del ADN Las largas instrucciones para fabricar un ser humano De qué están hechos nuestros cuerpos en un montón de cifras y medidas Cómo almacenar datos para que sigan existiendo dentro de un siglo ¿Qué son la vida y la muerte? ¿Qué es una máquina de Von Neumann? _____Imagen: GPT-4o # Enlace Permanente

Encontré unas cuantas disquisiciones interesantes en un artículo titulado How much information is in DNA? (¿Cuánta información hay en el ADN?) que al parecer estaba inspirado por las preguntas de otro: Mechanisms too simple for humans to design (Mecanismos demasiado simples para que los humanos los diseñen. Trata sobre un tema que hemos comentado por aquí alguna vez: cuánta información contiene el ADN humano.
El TL;DR sería unos 575 MB, según el autor (Dynomight). Esta cantidad de información cabría en un CD-ROM, y es menos que lo que ocupan muchas fotografías tomadas con un smartphone. En un teléfono móvil de 256 GB «cabrían» unos 450 humanos, apretaditos como sardinas en lata.
El artículo es bastante técnico y permite ampliar tu vocabulario científico con términos como retrotransposones, polimerasas, exones y centrómeros. Pero si te interesa el tema es una guía paso a paso de cómo se calcula todo.
El cálculo más «tirando por lo alto» parte de que el ADN tiene unos 3.100 millones de pares de bases, cada uno de los cuales puede tener cuatro valores (A, T, C, G). Teniendo en cuenta que cada base se podría codificar con 2 bits en total, harían falta unos 6.200 millones de bits, o 775 megabytes.
Calcular la cantidad de información del ADN es complicado. Para empezar, se desconoce una función clara para el 80-90 por ciento del genoma, aunque no por ello ha de ser «basura», pero ahí está el dato.
Además de eso, los humanos somos diploides y tenemos dos copias de cada cromosoma (uno proviene del padre y otro de la madre) y en ellos las bases se activan y desactivan por impronta genética, mutación, silenciamiento u otras razones. ¿Habría que contar ambas o solo una?
Además sucede que la información se puede comprimir, como sabe cualquiera que haya creado un archivo .ZIP o exportado un .JPEG, y hay razones para suponer que esto también es así en el ADN humano. Es una cuestión de economía y de practicidad.
Pero las formas de comprimir son muy distintas y hacen variar el tamaño de la información. Por ejemplo, como los seres humanos somos todos 99,6% similares se podría usar un «genoma estándar» de referencia y almacenar las diferencias; en este caso bastarían unos 15 MB.
Si se comprimieran sin ese genoma de referencia, que sería como un «ser humano básico», entonces el ahorro de espacio sería menor; la información del ADN quedaría en algo del orden más bien de unos 575 MB en total.
Según el autor, si además se descartaran las versiones comprimidas que no generan «seres humanos funcionales similares» la cosa estaría entre 60 y 750 MB. Pero dice que lo más probable es que estemos ante un ADN comprimido sin referencia, aunque poco comprimido, y se queda con 575 MB como valor a medio camino. Esa sería la información que contiene nuestro ADN.
Relacionado:
- Avances en el almacenamiento de información en moléculas de ADN
- The Genographic Project, ¿de dónde venimos? Nuestro ADN lo revela
- ADN con «marcas de agua» para identificar organismos patentados
- El genoma humano, grabado en cristal de 360 TB para la eternidad
- Genética: un secuenciador de ADN de menos de 1.000 dólares
- Pruebas de paternidad de ADN desde casa (un poco en plan Gattaca)
- ¿Qué es la información?
- Lo que nos deparará la secuenciación completa del ADN
- Las largas instrucciones para fabricar un ser humano
- De qué están hechos nuestros cuerpos en un montón de cifras y medidas
- Cómo almacenar datos para que sigan existiendo dentro de un siglo
- ¿Qué son la vida y la muerte?
- ¿Qué es una máquina de Von Neumann?
_____
Imagen: GPT-4o