¿Cuantos genes contiene el genoma humano? Número de opciones de empalme en rápida expansión

Genoma humano [Enciclopedia escrita en cuatro letras] Tarántula Vyacheslav Zalmanovich

¿Cuantos genes tiene una persona?

Ésta es la pregunta más interesante, por la cual se inició la secuenciación completa del genoma humano. Tras obtener información básica sobre la estructura del genoma humano, primero se llevaron a cabo diversos análisis para buscar genes y determinar su número. Sin embargo, la tarea no fue fácil. Esto puede parecer extraño al lector, pero todavía no hay una respuesta clara a la pregunta planteada.

¿Cuántos genes hay en el ADN humano? Hace unos años se creía que había alrededor de 100 mil, luego decidieron que no había más de 80 mil. A finales de 1998 llegaron a la conclusión de que no hay más de 50 a 60 mil genes. en el genoma humano y representan aproximadamente el 3 % de la longitud total del ADN.

Las últimas estimaciones del número total de genes del genoma humano fueron realizadas por varios equipos internacionales de científicos. La ya mencionada empresa “Celera” llevó a cabo su propia investigación, cuyos resultados fueron presentados en la revista “Science” en 2001. Ella estima que el número total de genes en el genoma humano está entre 26.383 y 39.114. Se estima que el tamaño promedio de los genes es de aproximadamente 3000 pb. Si asumimos que el número de genes en los humanos es de aproximadamente 30 mil y cada gen representa aproximadamente 3 mil pb, entonces es fácil calcular que menos del 1,5% del ADN cromosómico participa en la codificación de proteínas. Así, las instrucciones genéticas para la formación de la personalidad humana ocupan menos de 3 centímetros en una molécula de ADN de dos metros. También sorprende el pequeño número de genes que llevan estas instrucciones: sólo hay cinco veces más que, por ejemplo, en lo que consideramos un organismo completamente primitivo, la mosca Drosophila.

Un segundo equipo de investigadores del Instituto Nacional de Investigación Genómica de EE. UU., dirigido por Francis Collins, calculó el número de genes de una persona de forma independiente y basándose en sus datos, y obtuvo un resultado similar: el genoma de cada uno contiene alrededor de 32.000 genes. célula humana.

Hasta ahora, otros dos equipos de científicos están discrepando en las estimaciones finales. El Dr. William Heseltine (director de Ciencias del Genoma Humano) sigue insistiendo en que su banco contiene información privatizada sobre 120 mil genes. Por ahora no compartirá esta información con la comunidad mundial. La empresa ha invertido dinero en patentes y planea ganar dinero con la información obtenida, ya que se trata de genes de enfermedades humanas muy extendidas. La empresa Insight informó que actualmente cuenta con un catálogo de 140 mil genes humanos identificados por ella, y también insiste en esta cifra del total de genes en humanos.

Es obvio que la información genética apresuradamente privatizada seguirá siendo cuidadosamente analizada y verificada en los próximos años, hasta que finalmente se "canonice" el número exacto de genes. El hecho es que la estructura de los genes es muy diversa y aún no se comprenden completamente todas las opciones posibles. Aquí leemos la secuencia de nucleótidos del ADN. Se ha determinado que es capaz de codificar una proteína. ¿Pero está solo? Ya hemos discutido anteriormente cómo la transcripción y las modificaciones posteriores del ARN, y luego la traducción y modificaciones de los polipéptidos, pueden proporcionar una gran variedad de proteínas codificadas por una sección de ADN. Y a menudo es simplemente imposible entender esto basándose únicamente en la secuencia de nucleótidos del ADN. Sin embargo, la estructura del genoma representa la única base para comprender los datos obtenidos por nuevas direcciones nacidas de la genómica, como la transcriptómica (estudia la totalidad de las transcripciones de ARN del cuerpo), la proteómica (estudia la totalidad de las proteínas del cuerpo) , metabolómica (estudia el metabolismo - metabolismo - en el cuerpo). Estas direcciones pretenden complementar el método de secuenciación genómica que subyace a la genómica estructural y permitir ir más allá de los límites de su resolución.

El empalme alternativo también se analizó anteriormente. Ahora es bien sabido que gracias a este proceso, a partir de los mismos genes se pueden leer diferentes proteínas, que luego interactúan entre sí formando una mezcla única, de la misma manera que se pueden obtener infinidad de matices a partir de los colores primarios de la pintura: el amarillo. , rojo y azul. Este empalme es típico de al menos la mitad de los genes humanos. Se cree que, en promedio, se pueden formar tres péptidos diferentes a partir de un gen humano debido al empalme alternativo. Pero algunos genes tienen hasta 10 exones empalmados alternativamente, lo que permite, en teoría, generar más de 1.000 variantes de proteínas diferentes a partir de un solo gen. En realidad, el número de proteínas diferentes codificadas por un gen llega a 10. Además, también existen promotores alternativos, codones de iniciación de traducción alternativos, edición de ARN (conversión de C en U o A en el análogo G - inosina). Todo lo anterior aún no se puede tener en cuenta al estimar el número total de genes en humanos.

Pero eso no es todo. Además de los genes que codifican proteínas, también existen genes cuyo producto final es el ARN. Recordemos los genes riboreguladores mencionados anteriormente: no codifican proteínas, pero producen ARN que funciona en las células. Por lo tanto, lo más probable es que no se haga pronto una estimación final del número de genes en los seres humanos.

Hasta la fecha, los científicos sólo conocen las funciones de entre ocho y diez mil de ellos. Y la información detallada sobre los mecanismos de su regulación es aún más escasa. Sin embargo, los datos anteriores sobre la estructura y funcionamiento de los genes humanos indican que el hombre, que reina en la naturaleza, a diferencia de otros organismos existentes en nuestro planeta, tiene una complejidad muy alta. proteoma- un conjunto completo de proteínas funcionales en la célula, que está garantizado no simplemente por el gran tamaño del genoma o la gran cantidad de genes, sino gracias a todo tipo de innovaciones asociadas con el funcionamiento de los genes y la formación de proteínas: una mayor cantidad de módulos de dominio, mayor combinatoria (mezcla) de estos módulos en proteínas, uso activo de empalme alternativo y mucho más, de lo que hablaremos a continuación.

Del libro Preguntas frecuentes autor Protopopov Anatoly

¿Cómo distinguen los científicos la conducta determinada instintivamente de todo el complejo de actos conductuales humanos? De la misma manera que los lingüistas restauran antiguas lenguas extintas. Es decir, se comparan los patrones de comportamiento de personas pertenecientes a culturas muy diferentes,

Del libro El libro más nuevo de los hechos. Volumen 1 [Astronomía y astrofísica. Geografía y otras ciencias de la tierra. Biología y Medicina] autor

Del libro El Genoma Humano [Enciclopedia escrita en cuatro letras] autor Tarantul Vyacheslav Zalmanovich

Del libro El libro más nuevo de los hechos. Volumen 1. Astronomía y astrofísica. Geografía y otras ciencias de la tierra. Biología y medicina autor Kondrashov Anatoli Pavlovich

Del libro Lectura entre líneas del ADN [El segundo código de nuestra vida, o un libro que todos deberían leer] autor Spork Peter

Del libro Embriones, genes y evolución. por Raff Rudolf A.

¿Cuantos genes tiene una persona? Esta es la pregunta más interesante, por la cual se inició la secuenciación completa del genoma humano. Tras obtener información básica sobre la estructura del genoma humano, primero se llevaron a cabo diversos análisis sobre

Del libro Mundo animal autor Sitnikov Vitaly Pavlovich

¿Cuántos asteroides se conocen? Entre 1801 y 1891 sólo se descubrieron unos 200 asteroides. Con el inicio del uso de la fotografía (en 1891), comenzaron a descubrirse en grandes cantidades. A principios de 1987 ya se conocían unos 3.500 asteroides. Tasa de descubrimiento de asteroides nuevamente

Del libro Secretos de la herencia humana. autor Afonkin Sergey Yurievich

Del libro Secretos de género [El hombre y la mujer en el espejo de la evolución] autor Butovskaya Marina Lvovna

¿Cuántas plantas superiores hay en la Tierra? En total, existen alrededor de 300 mil especies de plantas superiores (embriones) en nuestro planeta, de las cuales se han estudiado aproximadamente 250 mil. Respecto a 50 mil especies de plantas, la ciencia aún no sabe si son útiles o no. Los expertos creen que si no es ahora

Del libro Síndrome de Paganini [y otras historias reales de genios escritas en nuestro código genético] por Keen Sam

¿Cuántos pelos hay en las pestañas de una persona? Las pestañas son pelos cortos y rígidos ubicados en 2-3 filas a lo largo del borde anterior del párpado en humanos y mamíferos y protegen la córnea del ojo de cuerpos extraños (por ejemplo, partículas de polvo). Una persona tiene entre 100 y 150 pestañas en el párpado superior y entre 50 y 70 en el

Del libro del autor.

¿Cuántos genes tiene una persona? Cada año, la élite de la biología molecular se reúne en un simposio en la ciudad de Cold Spring Harbor, en la pintoresca costa norte de Long Island, no lejos de Nueva York. En mayo de 2000 se habló de ello allí. ¡No podía ser de otra manera! - secuenciación

Del libro del autor.

¿Cuántos genes se necesitan para el desarrollo? Afortunadamente, existen métodos que nos permiten estimar la cantidad de información genética disponible en los organismos superiores. Uno de los métodos más sutiles es la genética mendeliana clásica. La principal dificultad asociada a este

Del libro del autor.

Del libro del autor.

Inventario de genes humanos El inventario es un control periódico de la presencia y estado de los activos materiales y del capital fijo y de trabajo en especie, así como del efectivo. Gran Enciclopedia de Cirilo y Metodio 2002 - Nuestros genes están llenos de moléculas

Del libro del autor.

¿Cuántos géneros tiene una persona? Entonces, ¿cuántos géneros hay en los humanos? A mediados del siglo XX, la respuesta habría sido: dos géneros. Sin embargo, en Estados Unidos y varios países europeos, así como en muchos países de Asia y África, es probable que ahora se dé una respuesta diferente: tres sexos. Para los europeos y

Del libro del autor.

Capítulo 14: Tres mil millones de pedacitos ¿Por qué los humanos no tenemos más genes que otras especies? Escala, alcance, ambición, décadas de trabajo y decenas de miles de millones de dólares son las razones por las que el Proyecto Genoma Humano, un intento de descifrar toda la cadena del ADN, está acertadamente

El genoma humano contiene aproximadamente 38.000 genes, que representan unidades individuales de herencia.

Las líneas de células germinales (células sexuales, reproductivas, de la línea germinal) contienen una copia del material genético y se denominan haploides, las células somáticas (células que no son de la línea germinal) contienen dos copias completas y se denominan diploides. Los genes se combinan en largos segmentos de ácido desoxirribonucleico (ADN) que, durante la división celular, junto con las proteínas, forman estructuras complejas compactas: los cromosomas. Cada célula somática tiene 46 cromosomas (22 pares de autosomas o cromosomas no sexuales y 1 par de cromosomas sexuales: XY en hombres y XX en mujeres). Las células sexuales (óvulos, espermatozoides) contienen 22 autosomas, 1 cromosoma sexual, es decir, 23 cromosomas en total. La fusión de células germinales conduce a la formación de un conjunto diploide completo de 46 cromosomas, que nuevamente se realiza en las células del embrión.

La molécula del genoma humano tiene tres bloques estructurales: un azúcar pentosa (desoxirribosa), un grupo fosfato y cuatro tipos de bases nitrogenadas: purina (adenina y guanina) o pirimidina (timina y citosina). Estos cuatro tipos de bases forman el alfabeto del código genético. La subunidad principal del ADN es un nucleótido, que consta de una molécula de desoxirribosa, un grupo fosfato y una base. Se combinan en una secuencia determinada: adenina con timina, citosina con guanina. Diferentes secuencias largas de bases de nucleótidos codifican diferentes proteínas. Los tripletes individuales corresponden a ARN de transferencia, cada uno de los cuales corresponde a un aminoácido específico. Cada genoma humano contiene alrededor de 3 mil millones de pares de nucleótidos, que en conjunto codifican todo el conjunto de proteínas del cuerpo humano.

Sólo una pequeña porción del ADN de la célula (10% del contenido total de ADN) funciona activamente durante el período metabólicamente activo del ciclo celular. Parte del material genético inactivo puede ser importante para regular la expresión genética o mantener la estructura y función de los cromosomas.

La mayor parte del genoma humano está contenido en los núcleos celulares. Las mitocondrias (orgánulos celulares que producen energía) contienen su propio genoma único. El cromosoma mitocondrial tiene una molécula de ADN circular de doble cadena, que incluye 16.000 pares de bases de ADN, cuya secuencia está completamente descifrada. Las proteínas que forman las mitocondrias pueden sintetizarse en las propias mitocondrias a partir de la información contenida en el genoma mitocondrial, o sintetizarse a partir de la información genética contenida en el genoma nuclear humano y transportarse a los orgánulos. Todas las mitocondrias se transmiten de la madre (ya que los espermatozoides generalmente no pasan las mitocondrias al óvulo fertilizado); Las mitocondrias con diferentes genomas dentro de la misma célula representan diferentes linajes de células madre de las que se originaron.

Estructura y función del genoma humano.

El objetivo principal del genoma humano es la producción de proteínas y enzimas estructurales. Este proceso implica una serie de etapas llamadas transcripción, procesamiento y traducción. Para transferir información, la molécula de ADN original se "desenreda" para formar ADN monocatenario, con una u otra cadena (o ambas) actuando como plantilla para la copia. Si esto ocurre durante la replicación celular, cada hebra de ADN se copia para formar dos nuevas moléculas hijas de ADN bicatenario; este proceso se llama replicación. Si el proceso ocurre durante un período metabólicamente activo del ciclo celular, solo se copia una hebra de ADN para formar ARN mensajero monocatenario (ARNm); este proceso se llama transcripción. El código de cada gen se transcribe del ADN al ARNm, incluida la información necesaria para codificar los aminoácidos (exones) y las secuencias de nucleótidos no codificantes ubicadas entre los exones (intrones).

El ARNm resultante se diferencia del ADN porque contiene ribosa en lugar de desoxirribosa y la base pirimidina uracilo en lugar de timina. Antes de salir del núcleo, la transcripción de ARNm primaria se procesa, durante el cual las regiones intrón no codificantes se eliminan de la molécula de ARNm y las regiones codificantes-exones restantes se combinan en una sola cadena para formar un ARNm funcional, que luego migra al citoplasma. , donde se produce la traducción. Durante la traducción, el ARNm regula la producción de proteínas en el ribosoma formando enlaces complementarios entre tres nucleótidos, llamados codones, y tres nucleótidos adicionales en la molécula de ARN de transferencia, llamados anticodones. A medida que el ribosoma se mueve a lo largo del ARN de un codón a otro, las enzimas combinan aminoácidos adyacentes unidos a moléculas de ARNt para formar enlaces peptídicos covalentes. La estructura de las cadenas polipeptídicas y, en última instancia, de las proteínas resultantes está determinada por las secuencias de nucleótidos del ARNm.

Fue hace siete años, el 26 de junio de 2000. En una conferencia de prensa conjunta con la participación del Presidente de los Estados Unidos y el Primer Ministro británico, representantes de dos grupos de investigación: Consorcio Internacional de Secuenciación del Genoma Humano(IHGSC) y Genómica Celera- anunció que los trabajos para descifrar el genoma humano, que comenzaron en los años 70, se han completado con éxito y se ha elaborado su versión preliminar. Ha comenzado un nuevo episodio del desarrollo humano: la era posgenómica.

¿Qué nos puede aportar descifrar el genoma? ¿Valen la pena los fondos y esfuerzos invertidos y los resultados obtenidos? Francisco Collins ( Francisco Collins), jefe del Programa Estadounidense del Genoma Humano, dio en 2000 la siguiente previsión para el desarrollo de la medicina y la biología en la era posgenómica:

  • 2010 - pruebas genéticas, medidas preventivas que reducen el riesgo de enfermedades y terapia génica para hasta 25 enfermedades hereditarias. Las enfermeras están comenzando a realizar procedimientos médicos genéticos. Los diagnósticos previos a la implantación están ampliamente disponibles y las limitaciones de este método se discuten activamente. Estados Unidos tiene leyes para prevenir la discriminación genética y respetar la privacidad. Las aplicaciones prácticas de la genómica no son accesibles para todos, especialmente en los países en desarrollo.
  • 2020 - Están apareciendo en el mercado medicamentos para la diabetes, la hipertensión y otras enfermedades, elaborados a partir de información genómica. Se están desarrollando terapias contra el cáncer que se dirigen específicamente a las propiedades de las células cancerosas en tumores específicos. La farmacogenómica se está convirtiendo en un enfoque común para el desarrollo de muchos fármacos. Cambiando la forma de diagnosticar las enfermedades mentales, surgiendo nuevos métodos de tratamiento, cambiando la actitud de la sociedad hacia este tipo de enfermedades. Las aplicaciones prácticas de la genómica todavía no están disponibles en todas partes.
  • 2030 - La determinación de la secuencia de nucleótidos de todo el genoma de un individuo se convertirá en un procedimiento rutinario que costará menos de 1.000 dólares. Se han catalogado los genes implicados en el proceso de envejecimiento. Se están realizando ensayos clínicos para aumentar la esperanza de vida máxima de los seres humanos. Los experimentos de laboratorio con células humanas han sido reemplazados por experimentos con modelos informáticos. Los movimientos masivos de opositores a las tecnologías avanzadas se están intensificando en Estados Unidos y otros países.
  • 2040 - Todas las medidas sanitarias generalmente aceptadas se basan en la genómica. La predisposición a la mayoría de las enfermedades está determinada (incluso antes del nacimiento). Se dispone de medicina preventiva eficaz adaptada al individuo. Las enfermedades se detectan en etapas tempranas mediante monitoreo molecular.
    La terapia génica está disponible para muchas enfermedades. Reemplazar medicamentos con productos genéticos producidos por el cuerpo en respuesta a la terapia. La esperanza de vida media alcanzará los 90 años gracias a la mejora de las condiciones socioeconómicas. Existe un serio debate sobre la capacidad del hombre para controlar su propia evolución.
    La desigualdad en el mundo persiste, creando tensiones a nivel internacional.

Como se desprende del pronóstico, la información genómica en un futuro próximo puede convertirse en la base para el tratamiento y la prevención de muchas enfermedades. Sin información sobre sus genes (y cabe en un DVD estándar), una persona en el futuro solo podrá curar la secreción nasal con algún curandero en la jungla. ¿Parece esto fantástico? ¡Pero hubo un tiempo en que la vacunación universal contra la viruela o Internet eran igual de fantásticos (tenga en cuenta que en los años 70 no existía)! En el futuro, el código genético del niño se entregará a los padres en el hospital de maternidad. Teóricamente, con un disco de este tipo, tratar y prevenir cualquier dolencia de una persona en particular será una mera nimiedad. Un médico profesional podrá en un tiempo extremadamente corto hacer un diagnóstico, prescribir un tratamiento eficaz e incluso determinar la probabilidad de que aparezcan diversas enfermedades en el futuro. Por ejemplo, las pruebas genéticas modernas ya pueden determinar con precisión el grado de predisposición de una mujer al cáncer de mama. Es casi seguro que dentro de 40 o 50 años ningún médico que se precie y que no tenga un código genético querrá "tratar a ciegas", del mismo modo que hoy en día la cirugía no puede prescindir de una radiografía.

Preguntémonos: ¿es fiable lo dicho, o quizás en realidad todo sea al revés? ¿Podrán finalmente las personas superar todas las enfermedades y alcanzarán la felicidad universal? Ay. Empecemos por el hecho de que la Tierra es pequeña y no hay suficiente felicidad para todos. En verdad, no es suficiente ni siquiera para la mitad de la población de los países en desarrollo. La “felicidad” está destinada principalmente a estados desarrollados en términos de ciencia, en particular de ciencias biológicas. Por ejemplo, hace tiempo que se patenta una técnica con la que se puede “leer” el código genético de cualquier persona. Se trata de una tecnología automatizada bien desarrollada, aunque cara y muy sutil. Si quieres, compra una licencia o, si quieres, inventa una nueva técnica. ¡Pero no todos los países tienen suficiente dinero para tal desarrollo! Como resultado, varios estados tendrán medicinas que estarán significativamente por delante del nivel del resto del mundo. Naturalmente, en los países subdesarrollados la Cruz Roja construirá hospitales de caridad, hospitales y centros genómicos. Y poco a poco esto conducirá a que la información genética de los pacientes de los países en desarrollo (que son la mayoría) se concentre en dos o tres poderes que financian esta caridad. Es difícil siquiera imaginar qué se puede hacer con esa información. Quizás esté bien. Sin embargo, también es posible otro resultado. La batalla por la prioridad que acompañó a la secuenciación del genoma ilustra la importancia de la disponibilidad de información genética. Recordemos brevemente algunos hechos de la historia del Programa Genoma Humano.

Quienes se oponían a la decodificación del genoma consideraban que la tarea era poco realista, porque el ADN humano es decenas de miles de veces más largo que las moléculas de ADN de virus o plásmidos. El principal argumento en contra fue: “ El proyecto requerirá miles de millones de dólares que otras áreas de la ciencia no tienen, por lo que el proyecto del genoma ralentizará el desarrollo de la ciencia en su conjunto. Pero si se encuentra dinero y se descifra el genoma humano, entonces la información resultante no justificará los costes...“Sin embargo, James Watson, uno de los descubridores de la estructura del ADN e ideólogo del programa de lectura total de la información genética, respondió ingeniosamente: “ Es mejor no pescar un pez grande que no pescar uno pequeño", . El argumento del científico fue escuchado: el problema del genoma se planteó para discusión en el Congreso de los Estados Unidos y, como resultado, se adoptó el programa nacional del Genoma Humano.

En la ciudad estadounidense de Bethesda, no lejos de Washington, se encuentra uno de los centros de coordinación de HUGO ( Organización del genoma humano). El centro coordina el trabajo científico sobre el tema "Genoma humano" en seis países: Alemania, Inglaterra, Francia, Japón, China y Estados Unidos. Al trabajo se unieron científicos de muchos países del mundo, unidos en tres equipos: dos interestatales y americanos. Proyecto Genoma Humano y británicos de Instituto Wellcome Trust Sanger- y una corporación privada de Maryland, que entró en juego un poco más tarde - Genómica Celera. Por cierto, quizás sea la primera vez en biología que una empresa privada compite con organizaciones intergubernamentales a un nivel tan alto.

La lucha se llevó a cabo utilizando medios y capacidades colosales. Como señalaron hace algún tiempo los expertos rusos, Celera se apoyó en el programa Genoma Humano, es decir, utilizó lo que ya se había hecho como parte del proyecto global. En realidad, Genómica Celera Me uní al programa no al principio, sino cuando el proyecto ya estaba en pleno desarrollo. Sin embargo, expertos de Celera Mejoró el algoritmo de secuenciación. Además, se construyó una supercomputadora por encargo, lo que hizo posible agregar los "componentes básicos" identificados del ADN en la secuencia resultante de manera más rápida y precisa. Por supuesto, todo esto no le dio a la empresa. Celera ventaja incondicional, pero la obligó a ser considerada participante de pleno derecho en la carrera.

Apariencia Genómica Celera Las tensiones aumentaron drásticamente: quienes estaban empleados en programas gubernamentales sintieron una competencia feroz. Además, tras la creación de la empresa, se agudizó la cuestión de la eficiencia del uso de la inversión pública. Dirigido por Celera se convirtió en el profesor Craig Venter ( Craig Venter) que tenía una amplia experiencia en trabajos científicos en el marco del programa estatal “Genoma Humano”. Fue él quien dijo que todos los programas públicos son ineficaces y que su empresa secuencia el genoma de forma más rápida y económica. Y luego apareció otro factor: las grandes empresas farmacéuticas se dieron cuenta. El hecho es que si toda la información sobre el genoma es de dominio público, perderán la propiedad intelectual y no habrá nada que patentar. Preocupados por esto, invirtieron miles de millones de dólares en Celera Genomics (con la que probablemente era más fácil negociar). Esto fortaleció aún más su posición. En respuesta a esto, los equipos del consorcio interestatal tuvieron que aumentar urgentemente la eficiencia del trabajo de decodificación del genoma. Al principio el trabajo estuvo descoordinado, pero luego se lograron ciertas formas de convivencia y la carrera empezó a acelerar su ritmo.

El final fue hermoso: las organizaciones competidoras, de mutuo acuerdo, anunciaron simultáneamente la finalización del trabajo para descifrar el genoma humano. Esto sucedió, como ya escribimos, el 26 de junio de 2000. Pero la diferencia horaria entre Estados Unidos e Inglaterra llevó a Estados Unidos al primer lugar.

Figura 1. La “Carrera por el Genoma”, en la que participaron una empresa intergubernamental y una privada, terminó formalmente en un “empate”: ambos grupos de investigadores publicaron sus logros casi simultáneamente. Genómica Celera Jefe de una empresa privada Craig Venter publicó su trabajo en la revista Ciencia en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista Naturaleza

, y la lista completa de autores cuenta con unas 2.800 personas que trabajan en casi tres docenas de centros en todo el mundo. Genómica Celera La investigación duró un total de 15 años. La creación del primer “borrador” del genoma humano costó 300 millones de dólares. Sin embargo, se han destinado unos tres mil millones de dólares a todas las investigaciones sobre este tema, incluidos los análisis comparativos y la solución de una serie de problemas éticos. Genómica Celera invirtió aproximadamente la misma cantidad, aunque la gastó en sólo seis años. El precio es colosal, pero esta cantidad es insignificante en comparación con los beneficios que el país en desarrollo recibirá de la victoria final sobre decenas de enfermedades graves que se esperan pronto. En una entrevista de principios de octubre de 2002 con The Associated Press, el presidente Craig Venter dijo que una de sus organizaciones sin fines de lucro planea producir CD que contengan la mayor cantidad de información posible sobre el ADN de un cliente. El coste preliminar de dicho pedido es de más de 700 mil dólares. Y uno de los descubridores de la estructura del ADN, el Dr. James Watson, ya recibió este año dos DVD con su genoma por un valor total de 1 millón de dólares; como vemos, los precios están bajando. Entonces, vicepresidente de la empresa. 454 Ciencias de la vida Michael Egholm ( Michael Egholm

La fama generalizada y la financiación a gran escala son un arma de doble filo. Por un lado, gracias a los fondos ilimitados, el trabajo avanza de forma fácil y rápida. Pero, por otro lado, el resultado de la investigación debe ser como está ordenado. A principios de 2001, se habían identificado con 100% de certeza más de 20 mil genes en el genoma humano. Esta cifra resultó ser tres veces menor de lo previsto apenas dos años antes. Un segundo equipo de investigadores del Instituto Nacional de Investigación Genómica de EE. UU., dirigido por Francis Collins, obtuvo de forma independiente los mismos resultados: entre 20 y 25 mil genes en el genoma de cada célula humana. Sin embargo, otros dos proyectos de investigación colaborativos internacionales agregaron incertidumbre a las estimaciones finales. Dr. William Heseltine (director ejecutivo) Estudios del genoma humano) insistieron en que su banco contenía información sobre 140 mil genes. Y por ahora no va a compartir esta información con la comunidad mundial. Su empresa ha invertido dinero en patentes y planea ganar dinero con la información obtenida en relación con genes de enfermedades humanas generalizadas. Otro grupo afirmó que había 120.000 genes humanos identificados y también insistió en que esta cifra reflejaba el número total de genes humanos.

Aquí es necesario aclarar que estos investigadores se dedicaron a descifrar la secuencia de ADN no del genoma en sí, sino de copias de ADN de ARN informativo (también llamado plantilla) (ARNm o ARNm). En otras palabras, no se estudió todo el genoma, sino solo la parte que la célula recodifica en ARNm y dirige la síntesis de proteínas. Dado que un gen puede servir como plantilla para la producción de varios tipos diferentes de ARNm (lo cual está determinado por muchos factores: tipo de célula, etapa de desarrollo del organismo, etc.), entonces el número total de todas las secuencias de ARNm diferentes (y esto es exactamente lo que patenta Estudios del genoma humano) será significativamente mayor. Lo más probable es que utilizar este número para estimar la cantidad de genes en el genoma sea simplemente incorrecto.

Obviamente, la información genética apresuradamente “privatizada” será cuidadosamente revisada en los próximos años hasta que finalmente el número exacto de genes sea generalmente aceptado. Pero lo alarmante es el hecho de que en el proceso de “cognición” se patenta todo lo que se puede patentar. ¡Ni siquiera es la piel de un oso muerto, pero en general todo lo que había en la guarida estaba dividido! Por cierto, hoy el debate se ha ralentizado y el genoma humano contiene oficialmente sólo 21.667 genes (NCBI versión 35, de octubre de 2005). Cabe señalar que por ahora la mayor parte de la información sigue estando disponible públicamente. Ahora existen bases de datos que acumulan información sobre la estructura del genoma no solo de los humanos, sino también de los genomas de muchos otros organismos (por ejemplo, EnsEMBL). Sin embargo, siempre se han realizado, se realizan y se seguirán realizando intentos de obtener derechos exclusivos para utilizar cualquier gen o secuencia con fines comerciales.

Hoy en día, los principales objetivos de la parte estructural del programa ya se han cumplido en gran medida: se ha leído casi por completo el genoma humano. La primera versión "borrador" de la secuencia, publicada a principios de 2001, estaba lejos de ser perfecta. Le faltaba aproximadamente el 30% de la secuencia del genoma en su conjunto, de los cuales alrededor del 10% era la secuencia del llamado eucromatina- Regiones de cromosomas ricas en genes y expresadas activamente. Según estimaciones recientes, la eucromatina constituye aproximadamente el 93,5% de todo el genoma. El 6,5% restante proviene de heterocromatina- estas regiones de los cromosomas son pobres en genes y contienen un gran número de repeticiones, lo que plantea serias dificultades a los científicos que intentan leer su secuencia. Además, se cree que el ADN de la heterocromatina está inactivo y no se expresa. (Esto puede explicar la “falta de atención” de los científicos hacia los “pequeños” porcentajes restantes del genoma humano.) Pero incluso las versiones “borradores” de secuencias eucromaticas disponibles en 2001 contenían una gran cantidad de interrupciones, errores y conexiones y orientaciones incorrectas. fragmentos. Sin desmerecer en modo alguno la importancia de este borrador para la ciencia y sus aplicaciones, cabe señalar que el uso de esta información preliminar en experimentos a gran escala que analizan el genoma en su conjunto (por ejemplo, al estudiar la evolución de genes o la organización general del genoma) reveló muchas imprecisiones y artefactos. Por lo tanto, era absolutamente necesario un trabajo adicional y no menos arduo, “los últimos pasos”.

Figura 2. Izquierda: Línea automatizada para preparar muestras de ADN para secuenciación en el Centro de Investigación Genómica del Instituto Whitehead. Bien: Un laboratorio en , lleno de máquinas para la decodificación de secuencias de ADN de alto rendimiento.

Completar el descifrado llevó varios años más y casi duplicó el coste de todo el proyecto. Sin embargo, ya en 2004 se anunció que la eucromatina se leía en un 99% con una precisión global de un error por cada 100.000 pares de bases. El número de descansos se ha reducido 400 veces. La precisión y la integridad de la lectura se han vuelto suficientes para una búsqueda efectiva de genes responsables de una enfermedad hereditaria particular (por ejemplo, diabetes o cáncer de mama). En términos prácticos, esto significa que los investigadores ya no tienen que pasar por el laborioso proceso de confirmar las secuencias de los genes con los que están trabajando, ya que pueden confiar completamente en una secuencia específica y públicamente disponible de todo el genoma.

De este modo, se superó con creces el plan original del proyecto. ¿Nos ha ayudado esto a comprender cómo está estructurado y funciona nuestro genoma? Indudablemente. Autores del artículo en en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista, en el que se publicó la versión “final” (a partir de 2004) del genoma, llevaron a cabo varios análisis con él, que habrían carecido absolutamente de sentido si sólo hubieran tenido a mano una secuencia “borrador”. Resultó que más de mil genes "nacieron" bastante recientemente (según los estándares evolutivos, por supuesto), en el proceso de duplicación del gen original y el posterior desarrollo independiente del gen hijo y el gen padre. Y poco menos de cuarenta genes han “muerto” recientemente, habiendo acumulado mutaciones que los dejaron completamente inactivos. Otro artículo publicado en el mismo número de la revista. en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista, señala directamente las deficiencias del método utilizado por los científicos de Celera. La consecuencia de estas deficiencias fue la omisión de numerosas repeticiones en las secuencias de ADN leídas y, como resultado, una longitud y complejidad subestimadas de todo el genoma. Para evitar que se repitan errores similares en el futuro, los autores del artículo propusieron utilizar una estrategia híbrida: una combinación de un enfoque altamente eficaz utilizado por los científicos de Celera, y el método comparativamente lento y laborioso, pero también más confiable, utilizado por los investigadores del IHGSC.

¿Hacia dónde irá a continuación el estudio sin precedentes del Genoma Humano? Algo se puede decir sobre esto ahora. Fundado en septiembre de 2003, el consorcio internacional ENCODE ( ESCiclopedia de los elementos del ADN) se fijó como objetivo el descubrimiento y estudio de “elementos de control” (secuencias) en el genoma humano. De hecho, 3 mil millones de pares de bases (es decir, la longitud del genoma humano) contienen sólo 22 mil genes, dispersos en este océano de ADN de una manera incomprensible para nosotros. ¿Qué controla su expresión? ¿Por qué necesitamos tal exceso de ADN? ¿Es realmente un lastre o todavía se manifiesta con algunas funciones desconocidas?

Para empezar, como proyecto piloto, los científicos de ENCODE examinaron "más de cerca" una secuencia que representa el 1% del genoma humano (30 millones de pares de bases), utilizando los últimos equipos para la investigación en biología molecular. Los resultados fueron publicados en abril de este año en en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista. Resultó que la mayor parte del genoma humano (incluidas regiones anteriormente consideradas "silenciosas") sirve como plantilla para la producción de varios ARN, muchos de los cuales no son informativos porque no codifican proteínas. Muchos de estos ARN "no codificantes" se superponen con genes "clásicos" (secciones de ADN que codifican proteínas). Otro resultado inesperado fue cómo se ubicaban las regiones reguladoras del ADN en relación con los genes cuya expresión controlaban. Las secuencias de muchas de estas regiones cambiaron poco durante la evolución, mientras que otras regiones que se pensaba que eran importantes para el control celular mutaron y cambiaron a velocidades inesperadamente altas durante la evolución. Todos estos hallazgos han planteado un gran número de nuevas preguntas, cuyas respuestas sólo podrán obtenerse en futuras investigaciones.

Otra tarea, cuya solución será cuestión de un futuro próximo, es determinar la secuencia de los “pequeños” porcentajes restantes del genoma que componen la heterocromatina, es decir, las secciones de ADN pobres en genes y ricas en repeticiones necesarias para la Duplicación de los cromosomas durante la división celular. La presencia de repeticiones hace que la tarea de descifrar estas secuencias sea intratable para los enfoques existentes y, por lo tanto, requiere la invención de nuevos métodos. Por lo tanto, no se sorprenda cuando se publique otro artículo en 2010, anunciando el "final" del descifrado del genoma humano: hablará sobre cómo se "hackeó" la heterocromatina.

Por supuesto, ahora sólo tenemos a nuestra disposición una determinada versión "media" del genoma humano. En sentido figurado, hoy sólo disponemos de la descripción más general del diseño de un coche: motor, chasis, ruedas, volante, asientos, pintura, tapizados, gasolina y aceite, etc. Un examen más detenido del resultado obtenido indica que existen Años de trabajo por delante perfeccionando nuestro conocimiento de cada genoma específico. El Programa del Genoma Humano no ha dejado de existir; sólo está cambiando de orientación: de la genómica estructural se pasa a la genómica funcional, diseñada para determinar cómo se controlan y funcionan los genes. Además, todas las personas se diferencian a nivel genético del mismo modo que los mismos modelos de coche se diferencian en distintas versiones de las mismas unidades. No sólo pueden diferir las bases individuales en las secuencias genéticas de dos personas diferentes, sino que también el número de copias de grandes fragmentos de ADN, que a veces incluyen varios genes, puede variar mucho. Esto significa que está pasando a primer plano el trabajo de comparación detallada de los genomas de, por ejemplo, representantes de diferentes poblaciones humanas, grupos étnicos e incluso de personas sanas y enfermas. Las tecnologías modernas permiten realizar estos análisis comparativos de forma rápida y precisa, pero hace diez años nadie soñaba con esto. Otra asociación científica internacional está estudiando las variaciones estructurales del genoma humano. En Estados Unidos y Europa se destinan importantes fondos a la financiación de la bioinformática, una ciencia joven que surgió en la intersección de la informática, las matemáticas y la biología, sin la cual es imposible comprender el océano ilimitado de información acumulada en la biología moderna. Los métodos de bioinformación nos ayudarán a responder muchas preguntas interesantes: “¿cómo surgió la evolución humana?”, “¿qué genes determinan ciertas características del cuerpo humano?”, “¿qué genes son responsables de la susceptibilidad a las enfermedades?” Ya sabes lo que dicen los ingleses: “ Este es el final del principio” - “Este es el fin del principio”. Esta misma frase refleja fielmente la situación actual. Comienza lo más importante y, estoy absolutamente seguro, lo más interesante: la acumulación de resultados, su comparación y su posterior análisis.

« ...Hoy lanzamos la primera edición del “Libro de la Vida” con nuestras instrucciones., - dijo Francis Collins en el canal de televisión Rossiya. - Recurriremos a él durante decenas, cientos de años. Y pronto la gente se preguntará cómo podrían arreglárselas sin esta información.».

Otro punto de vista se puede ilustrar citando al académico V.A. Kordyum:

“...Las esperanzas de que se abra completamente nueva información sobre las funciones del genoma son puramente simbólicas. Se puede predecir que surgirán centros gigantescos (sobre la base de los existentes) que podrán conectar todos los datos en un todo coherente, una especie de versión electrónica del Hombre e implementarlo en la práctica: genes, proteínas, células, tejidos, órganos y cualquier otra cosa. ¿Pero qué? ¿Agradable para quién? ¿Para qué? En el proceso de trabajo en el programa "genoma humano", se mejoraron rápidamente los métodos y equipos para determinar la secuencia primaria del ADN. En los centros más grandes esto se convirtió en una especie de actividad fabril. Pero incluso a nivel de dispositivos de laboratorio individuales (o más bien, de sus complejos), ya se ha creado un equipo tan avanzado que es capaz de determinar en tres meses una secuencia de ADN que tiene el mismo volumen que todo el genoma humano. No es sorprendente que surgiera (e inmediatamente comenzara a implementarse rápidamente) la idea de determinar los genomas de personas individuales. Por supuesto, es muy interesante comparar las diferencias de diferentes individuos al nivel de sus principios fundamentales. Los beneficios de tal comparación también son indudables. Será posible determinar quién tiene qué anomalías en el genoma, predecir sus consecuencias y eliminar aquello que puede provocar enfermedades. La salud estará garantizada y la vida se prolongará de manera bastante significativa. Esto es por un lado. Por otro lado, no todo es nada obvio. Obtener y analizar toda la herencia de un individuo significa obtener un expediente biológico completo y exhaustivo sobre él. Esto, si lo desea quien lo conoce, le permitirá hacer lo que quiera con una persona de la misma manera. Según la cadena ya conocida: una célula es una máquina molecular; una persona está formada por células; la célula en todas sus manifestaciones y en toda la gama de posibles respuestas queda registrada en el genoma; El genoma ya se puede manipular de forma limitada hoy en día, y en el futuro previsible se podrá manipular de casi cualquier forma...»

Sin embargo, probablemente sea demasiado pronto para temer pronósticos tan sombríos (aunque ciertamente es necesario conocerlos). Para implementarlos, es necesario reconstruir completamente muchas tradiciones sociales y culturales. El doctor en ciencias biológicas Mikhail Gelfand lo dijo muy bien en una entrevista. o. Subdirector del Instituto de Problemas de Transmisión de Información de la Academia de Ciencias de Rusia: “ ...si usted tiene, digamos, uno de los cinco genes que predeterminan el desarrollo de la esquizofrenia, entonces, ¿qué podría pasar si esta información (su genoma) cayera en manos de su potencial empleador, que no entiende nada de genómica?(y como resultado, es posible que no lo contraten por considerarlo arriesgado; y esto a pesar de que usted no tiene ni tendrá esquizofrenia - nota del autor). Otro aspecto: con la llegada de la medicina individualizada basada en la genómica, la medicina de seguros cambiará por completo. Después de todo, una cosa es prever riesgos desconocidos y otra cosa es prever riesgos completamente seguros. Para ser honesto, toda la sociedad occidental en su conjunto, no sólo la rusa, no está preparada ahora para la revolución genómica…” .

De hecho, para utilizar la nueva información de forma inteligente, es necesario comprenderla. Y para poder entender el genoma no es fácil de leer, esto está lejos de ser suficiente: nos llevará décadas. Está surgiendo un panorama muy complejo y, para comprenderlo, tendremos que cambiar muchos estereotipos. Por lo tanto, de hecho, el desciframiento del genoma aún está en curso y continuará. Y de nosotros depende si nos mantenemos al margen o finalmente nos convertimos en participantes activos en esta carrera.

Literatura

  1. Kiselev L. (2001). New Biology comenzó en febrero de 2001. "Ciencia y Vida";
  2. Kiselev L. (2002). La segunda vida del genoma: de la estructura a la función. "El conocimiento es poder". 7 ;
  3. Ewan Birney, el consorcio del proyecto ENCODE, John A. Stamatoyannopoulos, Anindya Dutta, Roderic Guigó, et. otros (2007). Identificación y análisis de elementos funcionales en el 1% del genoma humano mediante el proyecto piloto ENCODE. en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista. 447 , 799-816;
  4. Lincoln D. Stein. (2004). Genoma humano: fin del principio. en coautoría con ~ 270 científicos que trabajaron bajo su supervisión. El trabajo, realizado por el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC), fue publicado en la revista. 431 , 915-916;
  5. Gelfand M. (2007). Era posgenómica. "Biotecnología comercial".

Introducción………………………………………………………………………………...3

1. ¿Cuántos genes hay en el cuerpo humano?……………………...………… 5

2. El Proyecto Genoma Humano…………. …………………………………...……7

3. Resultados del Proyecto Genoma Humano…………………………………….….12

Conclusión……………………………………………………………………………….18

Referencias…………………………………………………………..….. 19

Introducción

“...Pero primero, limpia las habitaciones, lava las ventanas, abrillanta el piso, blanquea la cocina, quita las malas hierbas de los parterres, planta siete rosales debajo de las ventanas, separa siete sacos de frijoles: quita los blancos de los marrones. queridos, conócete a ti mismo...”

EL Schwartz. "Cenicienta"

Probablemente lo más difícil para Cenicienta en las tareas de su malvada e insidiosa madrastra fue: “¡Conócete a ti misma!” Todo lo demás es difícil, pero comprensible: las acciones son familiares, no necesitas inventar nada, solo sigue el ritmo... ¿Qué significa: "Conócete a ti mismo"? ¿Descubre cómo te mueves, piensas o respiras cuando recoges frijoles? ¿O tal vez el primer paso para comprender verdaderamente a una persona es descubrir cómo reproduce a los de su propia especie?

Cuando en 1986-1987, varios científicos estadounidenses comenzaron a persuadir increíblemente audazmente a los líderes del Departamento de Energía de los Estados Unidos para que asignaran varios miles de millones de dólares a un proyecto fantástico: descubrir la estructura de todos los genes humanos, este fue el paso correcto hacia el conocimiento de nosotros mismos. Habiendo aprendido la estructura de los genes, fue posible intentar invadir la comprensión de los procesos de pensamiento y respuesta a los estímulos provenientes del medio ambiente, etc. Tan pronto como se anunció el proyecto, llamado "Genoma Humano", comenzaron nuevos tormentos: muchas personas en todo el mundo, no sólo gente común, sino también profesores y directores de institutos, comenzaron a criticarlo duramente, calificándolo de "falso". poco realista y simplemente estúpido. No justificará la inversión, requerirá tanto esfuerzo que todos los científicos, habiendo abandonado otras cosas, no podrán afrontarlo, etc. La idea absorberá dinero, pero seguirá siendo inútil. Es demasiado pronto para empezar, insistieron estos expertos, la ciencia no está madura para resolver tales problemas, no se han creado capacidades técnicas, es mejor detener este ridículo invento desde el principio y usar el dinero para proyectos verdaderamente reales.

Si los especialistas en física nuclear o química física insistieran en esto, sería comprensible, porque otros proyectos costosos, principalmente en el campo de la física, fueron suspendidos a causa del “Genoma Humano”. Pero las voces de los biólogos, especialmente de Europa occidental y la URSS, también se destacaron en el coro de protestas. Es cierto que en la URSS había otros científicos, en particular el académico A.A. Baev, quien inmediatamente intentó involucrarse en el proyecto internacional y sacarle el máximo provecho.

Cuando el proyecto comenzó, parecía que tardaría al menos 20 años en completarse. Sin embargo, ya en el año 2000, gracias a los esfuerzos de científicos de todo el mundo, se leyó el genoma humano. Se puede comparar con un libro que contiene una secuencia de caracteres 800 veces más larga que la Biblia, pero el significado de la mayoría de las “frases” del texto del libro aún no nos queda claro y llevará muchos años descifrarlo. él. Cuanto más texto de nuestro genoma pueda descifrarse, más oportunidades habrá para la prevención y el tratamiento de enfermedades hereditarias, incluidas aquellas que afectan la esfera mental humana.

¿Cuántos genes hay en el cuerpo humano?

La base molecular del genoma humano es la molécula de ADN, el famoso "hilo de la vida", un modelo de estructura bicatenario que fue predicho y fundamentado brillantemente en el trabajo de los premios Nobel James Watson y Francis Crick en 1953. La hélice consta de 4 pares de bases (nucleótidos); dos purinas (adenina, guanina) y dos pirimidinas (timina y citosina), unidas entre sí a través de residuos de desoxirribosa y ácido fosfórico en un largo hilo. Las dos cadenas están conectadas entre sí mediante enlaces de hidrógeno de sus nucleótidos, de modo que la adenina siempre está unida a la timina y la guanina a la citosina. Más tarde resultó que fue en la alternancia de pares de bases en el ADN donde se estableció el código genético para cada uno de los 20 aminoácidos, y este código resultó ser de tres letras, es decir, cada aminoácido tiene el suyo. tres nucleótidos, su propio triplete. También se descubrió que en cada célula humana la longitud de la molécula de ADN es de aproximadamente 1,5 a 2 m, y el número de nucleótidos que componen este "hilo de vida" único alcanza los 3,3 mil millones. Fragmentos de este hilo forman los llamados genes, es decir, regiones codificantes del genoma que determinan la estructura de todas las proteínas del organismo. Por lo tanto, es natural que se obtengan datos precisos sobre la estructura del genoma humano, es decir, sobre la secuencia primaria de sus nucleótidos, así como los datos sobre todos los genes humanos, han atraído y continúan atrayendo durante mucho tiempo la mayor atención de los biólogos.

¿Cómo visualizar 3 mil millones de bases? Para reproducir la información contenida en el ADN de una sola célula, incluso en la letra más pequeña (como en las guías telefónicas), se necesitarían mil libros de 1.000 páginas. ¿Cuántos genes, es decir, secuencias de nucleótidos que codifican proteínas, hay en el ADN humano? Hace tres años creían que había alrededor de 100 mil, luego decidieron que no más de 80 mil. A finales de 1998 llegaron a la conclusión de que hay entre 50 y 60 mil genes en el genoma humano. Representan sólo el 3% de la longitud total del ADN. El papel del 97% restante aún no está claro.

Proyecto Genoma Humano

Las proteínas realizan una variedad de funciones en el cuerpo. Como enzimas, sirven como catalizadores de reacciones químicas; En el papel de las hormonas, ellas, junto con el sistema nervioso, controlan el funcionamiento de varios órganos mediante la transmisión de señales químicas. Las proteínas se utilizan en el cuerpo como materiales de construcción (por ejemplo, en el tejido muscular) y como vehículos (la hemoglobina sanguínea transporta oxígeno).

El alcance de la síntesis de proteínas que ocurre en la célula es enorme. El genoma humano (el conjunto de secuencias de ADN que determinan la individualidad genética de una persona) contiene alrededor de 6 mil millones de nucleótidos, a partir de los cuales se forman aproximadamente 100.000 genes, cuyo tamaño varía de 1.000 a 2 millones de pares de nucleótidos.

La descripción de todos los genes humanos y la decodificación de las correspondientes secuencias de ADN es la tarea principal del proyecto de investigación internacional "Genoma Humano", que es el proyecto genético más grande del mundo. Gracias a los esfuerzos de muchos laboratorios genéticos de todo el mundo, los científicos tendrán a su disposición una descripción completa del genoma humano.

El objetivo del proyecto es descubrir las secuencias de las bases nitrogenadas y las posiciones de los genes (mapeo) en cada molécula de ADN de cada célula humana, lo que revelaría las causas de las enfermedades hereditarias y las formas de tratarlas. El proyecto emplea a miles de especialistas de todo el mundo: biólogos, químicos, matemáticos, físicos y técnicos. Este es uno de los proyectos científicos más caros de la historia. En 1990 se gastaron 60 millones de dólares, en 1991, 135 millones, en 1992-1995. - de 165 a 187 millones por año, y en 1996-1998. Sólo Estados Unidos gastó 200, 225 y 253 millones.

El interés por los resultados ya obtenidos es enorme: los autores más citados en 1998 (no sólo en genética o biología, sino en todos los campos de la ciencia) son Mark Adams y Craig Venter del Genome Research Institute de Maryland (EE.UU.), una empresa privada. se dedica únicamente a la compilación de "mapas genéticos".

Hitos del proyecto

El proyecto consta de cinco etapas principales:

1. Elaboración de un mapa en el que se marcan los genes separados entre sí por no más de 2 millones de bases, en el lenguaje de los especialistas, con una resolución de 2 MB (Megabase - de la palabra inglesa "base" - base) ;

2. Realización de mapas físicos de cada cromosoma con una resolución de 0,1 MB;

3. Obtención de un mapa del genoma completo en forma de un conjunto de clones descritos individualmente (0,005 Mb);

4.Para 2004, secuenciación completa del ADN (resolución de 1 base);

5. Mapear con una resolución de 1 GB la base de todos los genes humanos (hasta 2005). Una vez completados estos pasos, los investigadores determinarán todas las funciones de los genes, así como las aplicaciones biológicas y médicas de los resultados.

tres cartas

Durante el proyecto, se crean tres tipos de mapas cromosómicos: genético, físico y secuencial (del inglés secuencia - secuencia). Identificar todos los genes presentes en el genoma y establecer las distancias entre ellos supone localizar cada gen en los cromosomas. Estos mapas genéticos, además de inventariar genes e indicar sus posiciones, responderán a la importantísima pregunta de cómo los genes determinan determinadas características de un organismo. Después de todo, muchos rasgos dependen de varios genes, a menudo ubicados en diferentes cromosomas, y el conocimiento de la posición de cada uno de ellos permitirá comprender cómo se produce la diferenciación (especialización) de células, órganos y tejidos, así como más tratar con éxito enfermedades genéticas. En los años 20 y 30, cuando se creó la teoría cromosómica de la herencia, el esclarecimiento de la posición de cada gen llevó al hecho de que en los mapas genéticos, primero de Drosophila, y luego del maíz y varias otras especies, era posible Marcan puntos especiales, como decían entonces, “marcadores genéticos”, “cromosomas”. El análisis de su posición en los cromosomas ayudó a proporcionar nueva información a los mapas genéticos de los cromosomas humanos. Los primeros datos sobre la posición de genes individuales aparecieron allá por los años 60. Desde entonces, se han multiplicado como una avalancha y ahora se conoce la posición de decenas de miles de genes. Hace tres años, la resolución del mapa genético era de 10 Mb (en algunas zonas, incluso de 5 Mb).

Otra área de investigación es la elaboración de mapas físicos de cromosomas. En los años 60, los citogenetistas comenzaron a teñir los cromosomas para identificar bandas transversales especiales en ellos. Después de la tinción, las rayas eran visibles al microscopio. Se logró establecer una correspondencia entre las bandas y los genes, lo que permitió estudiar los cromosomas de una manera nueva. Más tarde, aprendieron a "etiquetar" moléculas de ADN (con etiquetas radiactivas o fluorescentes) y a controlar la unión de estas etiquetas a los cromosomas, lo que aumentó significativamente la resolución de su estructura: hasta 2 Mb, y luego hasta 0,1 Mb (durante la fase celular). división). En los años 70, aprendieron a "cortar" el ADN en secciones con enzimas de "restricción" especiales que reconocen tramos cortos de ADN en los que la información está escrita en forma de palíndromos, combinaciones que se leen igual de principio a fin y de extremo a comienzo. Así surgieron los mapas de cromosomas de “restricción”. El uso de métodos y medios físicos y químicos modernos ha mejorado cientos de veces la resolución de los mapas físicos.

Finalmente, el desarrollo de métodos de secuenciación (el estudio de las secuencias exactas de nucleótidos en el ADN) abrió el camino a la creación de mapas de secuencias con una resolución récord hasta la fecha (estos mapas indicarán la posición de todos los nucleótidos en el ADN).

Dos enfoques

El número de cromosomas y su longitud varían entre las diferentes especies. Las células bacterianas tienen un solo cromosoma. Así, el tamaño del genoma de la bacteria Mycoplasma genitalium es de 0,58 Mb (contiene 470 genes), la bacteria Escherichia coli tiene 4200 genes (4,2 Mb) en su genoma y la planta Arabidopsis thaliana tiene 25 mil genes (100 Mb). , la mosca de la fruta Drosophila melanogaster tiene 10 mil genes (120 Mb). El ADN de ratones y humanos contiene entre 50 y 60 mil genes (3000 MB). Por supuesto, los mismos métodos no son aplicables para compilar mapas de objetos tan diferentes, por lo que utilizan dos enfoques diferentes en metodología. La primera consiste en dividir el ADN en pequeños fragmentos y estudiarlos individualmente para reconstruir la estructura completa. Este enfoque ha dado buenos resultados a la hora de elaborar mapas relativamente sencillos. Para genomas más complejos, el segundo enfoque es más eficaz. En estos casos, no es aconsejable dividir la molécula de ADN en trozos cortos que sean convenientes para un estudio detallado. Serían tantos que la confusión en las secuencias sería insoluble. Por eso, al empezar a descifrar, la molécula se divide, por el contrario, en trozos lo más largos posibles y se comparan con la esperanza de encontrar secciones terminales comunes. Si esto tiene éxito, se combinan las piezas, tras lo cual se repite el procedimiento. Con la mejora de las computadoras y los métodos matemáticos de procesamiento de información, las piezas combinadas según este principio se vuelven cada vez más grandes, acercándose gradualmente a la molécula completa. Este enfoque, en particular, permitió elaborar un mapa genético del tercer cromosoma de Drosophila.

Un tesoro escondido de nuevas tecnologías

Un aspecto importante del Proyecto Genoma Humano es el desarrollo de nuevos métodos de investigación. Incluso antes del inicio del proyecto, se desarrollaron varios métodos muy eficaces de investigación citogenética (ahora se denominan métodos de primera generación). Entre ellos: la creación y uso de las mencionadas enzimas de restricción. Producción de moléculas híbridas, su clonación y transferencia de secciones de ADN mediante vectores a células donantes (normalmente E. coli o levadura). Síntesis de ADN sobre plantillas de ARN mensajero. Secuenciación de genes. Copiar genes mediante dispositivos especiales. Métodos para analizar y clasificar moléculas de ADN por densidad, masa, estructura.

En los últimos 4-5 años, gracias al Proyecto Genoma Humano, se han desarrollado nuevos métodos (métodos de segunda generación), en los que casi todos los procesos están completamente automatizados. ¿Por qué esta dirección se volvió central? El cromosoma más pequeño de las células humanas contiene ADN de 50 Mb de largo, el más grande (cromosoma 1), 250 Mb. Hasta 1996, la sección más grande de ADN aislada de los cromosomas mediante reactivos tenía una longitud de 0,35 Mb, y con el mejor equipo se descifraba su estructura a una velocidad de 0,05-0,1 Mb por año a un costo de 1-2 dólares por base. En otras palabras, sólo este trabajo requeriría aproximadamente 30 mil días (casi un siglo) y 3 mil millones de dólares.

Las mejoras en la tecnología en 1998 aumentaron la productividad a 0,1 MB por día (36,5 MB por año) y redujeron el costo a 0,5 dólares por base. El uso de nuevos dispositivos electromecánicos, que además consumen menos reactivos, permitirá ya en 1999 acelerar el trabajo cinco veces más (para 2003 está previsto aumentar la velocidad de descifrado a 500 MB al año) y reducir el coste a 0,25 dólares. por base (incluso más barato para el ADN humano).


©2015-2019 sitio
Todos los derechos pertenecen a sus autores. Este sitio no reclama autoría, pero ofrece uso gratuito.
Fecha de creación de la página: 2016-02-12

El genoma del pez globo es aproximadamente ocho veces más pequeño que el genoma humano y 330 veces más pequeño que el genoma del pez pulmonado Protoptera. ¿Qué “fantasmas” viven en los “cementerios de genomas” y cuánta basura hay en nuestro ADN?

El renombrado biólogo molecular David Penney, del Centro Allen Wilson para la Ecología Molecular y la Evolución de la Universidad Massey de Nueva Zelanda, dijo una vez: “Me habría sentido muy orgulloso de haber formado parte del grupo que desarrolló el genoma de E. coli. Sin embargo, nunca admitiría que participé en el diseño del genoma humano. Ninguna universidad podría haber arruinado tanto este proyecto”. La cantidad de basura en nuestro ADN es uno de los temas más candentes en la comunidad científica. Entre los científicos se están produciendo verdaderas batallas verbales en torno a este tema.


La replicación (del latín replicatio - renovación) es el proceso de sintetizar una molécula hija de ácido desoxirribonucleico en la matriz original. Durante la siguiente división, cada una de las células hijas recibe una copia de una molécula de ADN idéntica al ADN de la célula madre original. La replicación del ADN se lleva a cabo mediante el replisoma, un complejo enzimático complejo que consta de 15 a 20 proteínas diferentes.

Un poco de genética molecular

Recordemos que la base para la transmisión de información hereditaria es la molécula de ADN bicatenario. Es un polímero de cuatro tipos de monómeros (nucleótidos): adenina (A), timina (T), citosina (C) y guanina (G), y está dispuesto en los cromosomas. Los humanos tenemos 23 pares de cromosomas ubicados en el núcleo (22 pares de cromosomas no sexuales y un par de cromosomas sexuales). Forman la base de nuestro genoma (otros 37 genes contienen ADN mitocondrial circular). Si tomáramos una célula humana, cosiéramos todo el conjunto diploide (emparejado) de cromosomas y lo estiráramos hasta formar un hilo, obtendríamos una molécula de dos metros de largo, que constaría de seis mil millones de pares de bases (nucleótidos). Tres mil millones de papá y tres de mamá.


Mosca de la fruta Drosophila melanogaster. Genoma de mosca modelo. Genoma: 120 millones de pares de bases. Genes: 13.500.

El tipo de secuencias de ADN funcionales más estudiado son los genes que codifican proteínas. A partir de dichos genes se lee una molécula de ARN, que luego desempeña el papel de matriz para la síntesis de proteínas y determina su secuencia de aminoácidos. La parte codificante de la molécula de ARN se puede dividir en tripletes de nucleótidos (codones), que corresponden a un determinado aminoácido o determinan el punto final de la síntesis de proteínas (codones de terminación). La regla para hacer coincidir codones con aminoácidos se llama código genético. Por ejemplo, el codón GCC codifica el aminoácido alanina.


Bacteria parcialmente sintética Mycoplasma laboratorium. Un genoma sintético en el que están codificados los nombres de los científicos que lo sintetizaron. Genoma: 580.000 pares de bases. Genes: 381.

¿Comparemos nuestros genes?

Alguna vez se pensó que un organismo tan complejo como una persona debía tener muchos genes. Cuando el Proyecto Genoma Humano estaba a punto de finalizar, los científicos incluso hicieron una apuesta: ¿cuántos genes se descubrirían? Imagínese su sorpresa cuando resultó que la cantidad de genes en los humanos y en el pequeño gusano redondo Caenorhabditis elegans es aproximadamente la misma. Un gusano tiene unos 20.000 genes y nosotros tenemos entre 20.000 y 25.000. Para la "corona de la creación", este hecho es bastante ofensivo, especialmente si se considera que hay muchos organismos con un genoma más grande (el genoma del pez pulmonado Protopterus aethiopicus es 40 veces más grande que el de un humano) y con un genoma más grande. número de genes (el arroz tiene entre 32 y 50 mil genes).


Nematodo de vida libre Caenorhabditis elegans. Genoma animal modelo pequeño. Genoma: 100 millones de pares de bases. Genes: ~20.000.

Pero en realidad, menos del 2% del genoma humano codifica alguna proteína. ¿Para qué se necesita el otro 98%? ¿Quizás ahí reside el secreto de nuestra complejidad? Resultó que existen importantes regiones de ADN no codificantes. Por ejemplo, estas son regiones de promotores: secuencias de nucleótidos en las que se asienta la enzima ARN polimerasa y desde donde comienza la síntesis de una molécula de ARN. Estos son sitios de unión para factores de transcripción: proteínas que regulan la función de los genes. Se trata de telómeros, que protegen los extremos de los cromosomas, y centrómeros, que son necesarios para la correcta separación de los cromosomas en diferentes polos de las células durante la división. Se conocen algunas moléculas de ARN reguladoras (por ejemplo, microARN que impiden la síntesis de proteínas de los genes correspondientes en el ARN mensajero, una copia del gen original), así como moléculas de ARN que forman parte de importantes complejos enzimáticos, por ejemplo, ribosomas. , que ensamblan proteínas a partir de aminoácidos individuales, moviéndose a lo largo del ARN mensajero. Hay otros ejemplos de importantes regiones no codificantes del ADN.


Rizoma de Thal Arabidopsis thaliana. Genoma de planta modelo pequeño. Genoma: 119 millones de pares de bases. Genes: ~25.000.

Sin embargo, la mayor parte de nuestro genoma se parece a un desierto: secuencias repetidas, restos de virus “muertos” que alguna vez se integraron en los genomas de nuestros antepasados ​​hace mucho tiempo; los llamados elementos móviles egoístas: secuencias de ADN que pueden saltar de una parte del genoma a otra; Varios pseudogenes son secuencias de nucleótidos que han perdido la capacidad de codificar proteínas como resultado de mutaciones, pero que aún conservan algunas de las características de los genes. Esta no es una lista completa de los "fantasmas" que viven en el "cementerio del genoma".

Dos veces más inteligente que las moscas

La idea de realizar un sorteo sobre el número de genes humanos se le ocurrió al Dr. Evan Birney en un bar de un laboratorio en Cold Spring Harbor poco antes de la finalización del Proyecto Genoma Humano. A medida que nos acercábamos a la final, de 2000 a 2002, las apuestas aumentaron de 1 dólar a 20. Como resultado, el bote se dividió en tres: Paul Dear, del British Medical Research Council, que allá por el año 2000 apostó por su fecha. de nacimiento - 27.04.1962 - 27.462, Lee Rowan del Instituto de Biología de Sistemas de Seattle - en 2001 apostó por el número 25.947, y Oliver Jaylon de la empresa francesa Genoscope (26.500). Cuando le preguntaron al ganador principal, el Dr. Dear, cómo logró adivinar el número con tanta precisión hace tres años, cuando todos pensaban que una persona tiene al menos 50.000 genes, respondió: “Fue en un bar, a altas horas de la noche. . Al observar el comportamiento de las personas que beben, pensé que se diferenciaba poco del comportamiento de las moscas de la fruta, que tienen 13.500 genes, y por lo tanto me pareció que el doble de genes de moscas era suficiente para las personas”.

Ratón mínimo

Existe la opinión de que la mayor parte del genoma humano no es funcional. En 2004, la revista Nature publicó un artículo que describe ratones de cuyo genoma se extrajeron fragmentos importantes de ADN no codificante de 0,8 e incluso 1,5 millones de nucleótidos. Se demostró que estos ratones no se diferencian de los ratones comunes en la estructura corporal, el desarrollo, la esperanza de vida o la capacidad de tener descendencia. Por supuesto, algunas diferencias pueden pasar desapercibidas, pero en general este fue un argumento serio a favor de la existencia de "ADN basura", del que se puede deshacerse sin consecuencias especiales. Por supuesto, sería interesante eliminar no un par de millones de nucleótidos, sino mil millones, dejando sólo las secuencias genéticas predichas y los elementos funcionales conocidos. ¿Será posible desarrollar un “ratón mínimo” y podrá existir normalmente? ¿Puede una persona arreglárselas con un genoma de sólo medio metro de longitud? Quizás algún día nos enteremos de esto. Mientras tanto, otro argumento importante a favor de la existencia de ADN basura es la presencia de organismos bastante parecidos con tamaños de genoma muy diferentes. El genoma del pez globo es aproximadamente ocho veces más pequeño que el genoma humano (aunque tiene aproximadamente la misma cantidad de genes) y 330 veces más pequeño que el genoma del pez Protoptera ya mencionado. Si cada nucleótido del genoma fuera funcional, entonces no está claro por qué las cebollas necesitarían un genoma cinco veces más grande que el nuestro.


El biólogo evolutivo Susumu Ono notó las colosales diferencias en el tamaño de los genomas de organismos similares. Se cree que Ono acuñó el término "ADN basura". En 1972, mucho antes de que se leyera el genoma humano, Ono expresó ideas plausibles tanto sobre el número de genes en el genoma humano como sobre la cantidad de "basura" que contiene. En su artículo “Tanto ADN basura en nuestro genoma”, señala que debe haber unos 30.000 genes en el genoma humano. Este número, que en aquel momento no era nada obvio, resultó sorprendentemente cercano al real, que se descubrió décadas después. Además, Ono proporciona una estimación de la fracción funcional del genoma (6%), declarando que más del 90% del genoma humano es basura.


Mimivirus Mimivirus Acanthamoeba polyphaga. Genoma viral más grande conocido. Genoma: 1.181.404 pares de bases. Genes: 979.

¿Encontrar o basura?

La idea de la existencia de ADN basura fue cuestionada por el proyecto ENCODE, la Enciclopedia de elementos del ADN (sus primeros resultados se publicaron en la revista Nature en 2012). Habiendo recibido numerosos datos experimentales sobre qué partes del genoma humano interactúan con diversas proteínas, participan en la transcripción (síntesis de copias de ARN de genes para su posterior traducción (síntesis de proteínas a partir de aminoácidos en una matriz de ARN mensajero)) u otros procesos bioquímicos, Los autores llegaron a la conclusión de que más del 80% del genoma humano es funcional de una forma u otra. Por supuesto, esta tesis provocó acaloradas discusiones en la comunidad científica.


Pez pulmonado Protopterus aethiopicus. Genoma más grande conocido. Genoma: 133 mil millones de pares de bases. Genes: muchos.

Uno de los artículos más irónicos, publicado por Dan Graur, bioinformático evolutivo molecular y profesor de la Universidad de Houston, y sus colegas en 2013 en la revista Genome biology and Evolution, se titula: “Sobre la inmortalidad de los televisores: “función” en el genoma humano sin evolución Evangelio según ENCODE". Sus autores señalan que los miembros individuales del consorcio ENCODE no están de acuerdo sobre qué parte del genoma es funcional. Así, uno de ellos pronto aclaró en la revista Genomicron que no estamos hablando del 80% de las secuencias funcionales del genoma, sino de alrededor del 40%, y el otro (en un artículo de Scientific American) redujo completamente la cifra al 20%. , pero siguió insistiendo en que es necesario eliminar del léxico el término “ADN basura”.


Virus de inmunodeficiencia humana (VIH). El genoma rápidamente cambiante del virus de la inmunodeficiencia humana. Genoma: 9749 pares de bases (pero ya mutado). Genes: 9, pero codifican 18 proteínas.

Según los autores del artículo "Sobre la inmortalidad de los televisores", los miembros del consorcio ENCODE interpretan el término "función" con demasiada libertad. Por ejemplo, existen proteínas llamadas histonas. Pueden unir la molécula de ADN y ayudarla a plegarse de forma compacta. Las histonas pueden sufrir ciertas modificaciones químicas. Según ENCODE, la función propuesta de una de estas modificaciones de histonas es “preferir estar en el extremo 5" de los genes" (el extremo 5" es el extremo del gen desde el cual se mueven las enzimas ADN y ARN polimerasas al copiar ADN o durante la transcripción). “De la misma manera, se podría decir que la función de la Casa Blanca es ocupar el espacio en 1600 Pennsylvania Avenue, Washington, D.C.”, señalan los opositores.

Kasha iba en moto

A veces en los medios se puede escuchar la frase incorrecta “el código genético ha mutado”. Pero las mutaciones no ocurren en el código, sino en la molécula de ADN (en el genoma). Como resultado, las secuencias de nucleótidos cambian. Esto se puede comparar con reemplazar una letra en una palabra. Por ejemplo, la frase "Masha conducía una motocicleta" se convierte en "Sasha conducía una motocicleta" si una letra M "muta" en la letra S. Cambiar el código genético es mucho más serio: es como cambiar el alfabeto. Imaginemos que en todo el texto la letra M de repente se convierte en la letra K. Ahora tenemos "Kasha andaba en bicicleta con un gato". Está claro que tales cambios tienen consecuencias importantes y, por lo tanto, ocurren muy raramente en la naturaleza. ¡Pero suceden! Por ejemplo, en algunos ciliados, uno de los codones de terminación puede codificar el aminoácido glutamina. Pero ésta es más la excepción que la regla. La mayoría de los organismos tienen el mismo código genético: por ejemplo, un humano, un gusano o un pepino. Pero los genomas de estos organismos difieren mucho. Mismo alfabeto, pero texto diferente.

También existe un problema con la asignación de funciones a las secciones de ADN. Supongamos que una proteína importante para el funcionamiento de la célula es capaz de unirse a una determinada sección de ADN y, por lo tanto, ENCODE asigna una "función" a esta sección. Por ejemplo, cierto factor de transcripción, una proteína que inicia la síntesis del ARN mensajero, se une a la siguiente secuencia de nucleótidos: TATAAA. Consideremos dos secuencias TATAAA idénticas en diferentes partes del genoma. Después de que el factor de transcripción se une a la primera secuencia, comienza la síntesis de una molécula de ARN, que sirve como plantilla para la síntesis de otra proteína importante. Las mutaciones (sustituciones de cualquiera de los nucleótidos) en esta secuencia harán que el ARN se lea mal, la proteína no se sintetice y esto probablemente afectará negativamente la supervivencia del organismo. Por tanto, la secuencia TATAAA correcta se mantendrá en un lugar determinado del genoma mediante selección natural, en cuyo caso procede hablar de su función.


Pez globo Fugu rubripes. Genoma de vertebrados más pequeño conocido. Genoma: 390 millones de pares de bases. Genes: 20-28 mil.

Otra secuencia TATAAA surgió en el genoma por razones aleatorias. Como es idéntico al primero, también se le une un factor de transcripción. Pero no hay ningún gen cerca, por lo que la unión no conduce a nada. Si se produce una mutación en esta zona, nada cambiará y el cuerpo no sufrirá. En este caso no tiene sentido hablar de la función de la segunda sección de TATAAA. Sin embargo, puede resultar que la presencia de una gran cantidad de secuencias TATAAA en el genoma alejadas de los genes sea simplemente necesaria para unir el factor de transcripción y reducir su concentración efectiva. En este caso, la selección regulará el número de dichas secuencias en el genoma.


Cebolla Allium cepa. Uno de los genomas vegetales más grandes. Genoma: 16 mil millones de pares de bases. Genov: desconocido.

Para demostrar que una determinada región del ADN es funcional, no basta con demostrar que en esta región se produce algún proceso biológico (por ejemplo, la unión del ADN). Los miembros del consorcio ENCODE escriben que las regiones del ADN implicadas en la transcripción tienen una función. "Pero ¿por qué es necesario centrarse en el hecho de que el 74,7% del genoma se transcribe, mientras que podemos decir que el 100% del genoma participa en un proceso bioquímico reproducible? ¡La replicación!", bromea Graur.


Mosquitos campana sin alas antárticos Belgica antarctica. El genoma más pequeño de artrópodos. Genoma: 99 millones de pares de bases. Genes: ~14.000.

Un buen criterio para la funcionalidad de una región del ADN es que las mutaciones en ella son bastante dañinas y no se observan cambios significativos en esta región de generación en generación. ¿Cómo identificar esas áreas? Aquí es donde viene al rescate la bioinformática, una ciencia moderna en la intersección de la biología y las matemáticas sobre el análisis de secuencias de genes y proteínas. Podemos tomar los genomas humanos y de ratón y encontrar en ellos todas las secciones de ADN similares. Resulta que en estas dos especies algunas partes de las secuencias de nucleótidos son muy similares. Por ejemplo, los genes necesarios para la síntesis de proteínas ribosómicas son bastante conservadores, es decir, las mutaciones en ellos son lo suficientemente dañinas como para que los portadores de nuevas mutaciones mueran sin dejar descendencia. Se dice que estos genes están bajo selección negativa, lo que los libera de mutaciones dañinas. Otras regiones de los genomas tendrán divergencias significativas entre especies, lo que indica que las mutaciones en estas regiones probablemente sean inofensivas y, por lo tanto, su papel funcional es pequeño o no está determinado por una secuencia de nucleótidos específica. Varios estudios han estimado la proporción de regiones del ADN humano bajo presión de selección negativa. Resultó que solo les pertenece entre el 6,5 y el 10% del genoma y que las regiones no codificantes, a diferencia de las codificantes, son mucho menos susceptibles a la selección negativa. Resulta que, desde el punto de vista de criterios evolutivos, menos del 10% del genoma humano es funcional. ¡Observe lo cerca que estaba Ono de esta estimación en 1972!


La bacteria Hodgkinia cicadicola. Genoma bacteriano más pequeño conocido. Una bacteria simbionte con un código genético no estándar. Genoma: 144.000 pares de bases. Genes: 189.

Fortaleza de basura

Pero, ¿el 90% restante del genoma humano es realmente basura de la que es mejor deshacerse? No precisamente. Se considera que un genoma de gran tamaño puede ser beneficioso en sí mismo. En las bacterias, la replicación del genoma es un factor limitante grave que requiere un gasto energético significativo. Por tanto, sus genomas suelen ser pequeños y se deshacen de todo lo innecesario. En organismos grandes, por regla general, la replicación del ADN de las células en división no contribuye tanto al gasto total de energía del cuerpo en el contexto de los gastos para el funcionamiento del cerebro, los músculos, los órganos excretores y el mantenimiento de la temperatura corporal. , etc. Al mismo tiempo, un genoma grande puede ser una fuente importante de diversidad genética, aumentando las posibilidades de que surjan nuevas regiones funcionales a partir de otras no funcionales debido a mutaciones que son potencialmente útiles en el proceso de evolución. Los elementos transponibles pueden transferir elementos reguladores, creando diversidad genética en la regulación de la función genética. Es decir, los organismos con genomas grandes, en teoría, pueden adaptarse más rápido a las condiciones ambientales, pagando costos adicionales relativamente pequeños por la replicación de un genoma más grande. No encontraremos este efecto en un organismo individual, pero puede desempeñar un papel importante a nivel de población.


Homo sapiens. Se estima que el genoma es 90% basura. Genoma: 3 mil millones de pares de bases. Genes: 20-25 mil.

Tener un genoma grande también puede reducir la probabilidad de que un virus se inserte en un gen funcional (lo que puede provocar una falla genética y, en algunos casos, cáncer). En otras palabras, es posible que la selección natural pueda actuar no sólo para mantener secuencias específicas en el genoma, sino para preservar ciertos tamaños del genoma, composición de nucleótidos en algunas de sus regiones, etc.


Sin embargo, aunque la idea de que sólo el 80% o incluso el 20% del genoma humano sea funcional sea controvertida, esto no significa que todo el proyecto ENCODE sea objeto de críticas. En su marco se ha obtenido una gran cantidad de datos sobre cómo se unen las diferentes proteínas al ADN, información sobre la regulación genética, etc. Estos datos son de gran interés para los especialistas. Pero es poco probable que en un futuro próximo sea posible deshacerse de la "basura" del genoma, tanto del concepto como de las secuencias innecesarias.



¿Te gustó el artículo? ¡Comparte con tus amigos!