PIROSECUENCIACIÓN Un aspecto importante de esta técnica es que todos los pasos se realizan “in vitro”, a diferencia de la tecnología Sanger. Esta técnica comienza con el procesado y adaptación del ADN para obtener una librería de pequeños fragmentos monocatenarios. Lo primero es fragmentar el ADN a secuenciar mediante un proceso físico conocido como “nebulización” donde el ADN se rompe en fragmentos de 200 a 800 pares de bases aproximadamente. Posteriormente, mediante protocolos estandarizados de biología molecular, se añaden dos pequeñas secuencias adaptadoras a cada fragmento de ADN obtenido en la nebulización. El adaptador A y el B. Las secuencias adaptadores están diseñadas para cumplir funciones en los pasos de selección, amplificación y secuenciación. El siguiente paso es seleccionar los fragmentos de ADN a los que se han unido correctamente los adaptadores. Para esto, los fragmentos de ADN se unen a unas esferas especiales por la parte 3´ del adaptador B. Esta unión no es por complementariedad de bases. Los fragmentos que solo contengan adaptador A no se unirán a las esferas y son eliminados y los que contengan dos adaptadores B se unirán por dos puntos. Los fragmentos de doble cadena unidos a estas esferas son sometidos a alta concentración de NaOH que provoca la separación de las cadenas simples. Si el fragmento tiene dos adaptadores B se separarán las cadenas pero ambas permanecerán unidas a las esferas. Como resultado de este sencillo proceso se liberan de las esferas los fragmentos de cadena simple que tienen un adaptador de cada clase con el B situado en el extremo 5´ del fragmento, ya que los fragmentos complementarios a estos permanecerán unidos por el extremo 3´ del adaptador B. Para el proceso de amplificación, los fragmentos libres de cadena simple se unen a otras esferas que tienen un gran número de secuencias complementarias del adaptador A. Esta unión está optimizada para que solo se una un fragmento a una esfera. Una vez unidos los fragmentos a las esferas se introducen en una emulsión de agua y aceite de forma que cada esfera quede dentro de una gota con todos los reactivos y encimas necesarios para la PCR. Tras una serie de termociclos de PCR se habrán generado en cada esfera un gran número de secuencias de doble cadena idénticas y unidas por el adaptador A. De nuevo, las esferas son sometidas a alta concentración de NaOH para separar las cadenas complementarias. El resultado es que cada esfera tiene adherido a su superficie un gran número de cadenas simples idénticas unidas por el extremo 3´. Antes de empezar la secuenciación en sí misma se añaden cebadores complementarios al adaptador B en posición 5´, ADN polimerasas y los cofactores necesarios para la síntesis de la cadena complementaria a los fragmentos unidos a las esferas. El siguiente paso es cargar las esferas en un dispositivo conocido como “PicoTiterPlate” que es el que se introduce en el secuenciador. Este dispositivo consta de más de un millón de pocillos de 44 micras de diámetro de forma que solo quepa una esfera con fragmentos de ADN por pocillo. Además de las esferas con ADN, se introducen otro tipo de esferas que contienen las enzimas necesarias para detectar la incorporación de nucleótidos durante la síntesis de la cadena complementaria. Estas enzimas son la sulfurilasa y la luciferasa. La sulfurilasa genera ATP a partir de pirofosfato y la luciferasa se transforma en oxiluciferina en presencia de ATP con emisión
de luz. De esta forma se construye una cascada enzimática que empieza cuando la ADN polimerasa incorpora un nucleótido a la cadena creciente complementaria del ADN a secuenciar liberando un pirofosfato y termina cuando la luciferasa emite luz. Una vez cargadas las esferas con ADN y las esferas con enzimas, el “PicoTiterPlate” se introduce en el secuenciador. El secuenciador automatiza el proceso de secuenciación, la captura de imágenes y su interpretación. El secuenciador vierte automáticamente sobre los pocillos los reactivos necesarios y un tipo de nucleótido cada vez. Así de forma cíclica se irán vertiendo As, Cs, Gs y Ts. En cada pocillo, la ADN polimerasa añadirá uno o más nucleótidos dependiendo de la secuencia que actúa como molde y se emitirá luz con una intensidad proporcional al númerro de nucleótidos incorporados a la nueva cadena que se va sintetizando durante el proceso de secuenciación. El secuenciador consta de un sistema óptico especial que recoge el patrón de destellos luminosos que se emiten en el “PicoTiterPlate”. Mediante programas informáticos se interpretan estos patrones de luz y se generan unas gráficas que indican si ha habido incorporación o no de nucleótidos y su número. Después de esto se lava el exceso de nucleótidos y reactivos y se repite el proceso con otro tipo de nucleótido de forma cíclica hasta que finalice la síntesis de una cadena complementaria a la cadena que actúa como molde. El resultado es la secuenciación de los fragmentos que hay en cada pocillo. En los adaptadores hay unas secuencias conocidas que sirven para calibrar los aparatos de recepción e interpretación de imágenes. Uno de los defectos de este sistema es la pérdida de precisión en las regiones homopoliméricas. La posibilidad de automatizar y de paralelizar el proceso de secuenciación que ofrece esta técnica es una de las principales ventajas frente a otros métodos de secuenciación. La pirosecuenciación permite la secuenciación de grandes cantidades de ADN en menos tiempo que otras técnicas y con un coste menor.
SOLiD El método de secuenciación sólido se basa en la secuenciación mediante ligación de oligonucleótidos marcada con colorante. Applied Biosystems sólidos (por secuenciación de detección de ligación de oligonucleótidos) se compone de 4 partes. a) b) c) d)
Preparación Biblioteca Emulsión PCR y granos del enriquecimiento del grano Deposición de bolas La secuenciación por ligadura
Preparación Biblioteca 1. Preparar uno de los dos tipos de bibliotecas (Figura 1) para Solid ™ Sistema de secuenciación-fragmento o compañero-dos a dos. La elección de la biblioteca depende de la aplicación que se está realizando y la información que desea de sus experimentos.
Figura 1
Emulsión de PCR / cuentas Enriquecimiento 2. Preparar poblaciones clonales de cuentas (Figura 2) en microrreactores que contienen plantilla, los componentes de reacción de PCR, las cuentas, y los cebadores. 3. Después de la PCR, desnaturalizar las plantillas y llevar a cabo el enriquecimiento de cuentas para cuentas separadas con las plantillas extendidas de las cuentas no deseadas. La plantilla de las cuentas seleccionadas se somete a una modificación 3 'para permitir la unión covalente a la diapositiva.
Figura 2
Deposición de las cuentas Cuentas modificados Depósito 3 'en un portaobjetos de vidrio (Figura 3). Durante la carga de las cuentas, cámaras de depósito le permiten segmentar una caída en uno, cuatro, u ocho secciones. Una ventaja clave del sistema es la capacidad de acomodar el aumento de las densidades de los cuentas por portaobjetos, lo que resulta en un nivel más alto de rendimiento desde el mismo sistema.
Figura 3
La secuenciación mediante ligadura 5. Los cebadores se hibridan con la secuencia de adaptador de P1 en las perlas con plantilla (Figura 4). 6. Un conjunto de cuatro sondas marcadas con fluorescencia di-base compiten por la ligación al cebador de secuenciación. La especificidad de la sonda di-base se realiza con la interrogación a cada primera y segunda de base en cada reacción de ligación. 7. Los ciclos múltiples de la ligadura, la detección y la escisión se llevan a cabo con el número de ciclos que determinan la longitud de lectura eventual. 8. Tras una serie de ciclos de ligación, el producto de extensión se retira y la plantilla se restablece con un cebador complementario a la posición N-1 para una segunda ronda de ciclos de ligación
Figura 4
Restablecer el primer 9. Cinco rondas de reposición del primer se han completado para cada etiqueta de secuencia (Figura 5). A través del proceso de restablecimiento de primer, prácticamente cada base es interrogada en dos reacciones de ligación independientes por dos cebadores diferentes
Figura 5
Illumina HiSeq La plataforma conocida como Illumina Genome Analyzer. Esta es basada en el concepto de secuenciación mediante síntesis, el cual permite producir secuencias de 32 a 40 pares de bases de decenas de millones de fragmentos de ADN. Dentro de las principales características técnicas de esta estrategia está el uso de una celda de flujo de vidrio (del inglés glass flow cell). Esta celda es compuesta de 8 líneas en las cuales se encuentran oligos covalentemente unidos a la superficie. Estos oligos se hibridan con el ADN a secuenciar mediante la ayuda de adaptadores y de tratamientos de temperatura. Reactivos de PCR son añadidos sobre estas celdas con el fin de amplificar los fragmentos en áreas discretas o “clusters”. Esta PCR es conocida como amplificación en puente y determina el fin de los pasos de la pre-secuenciación. A continuación las celdas son llevadas a la plataforma Illumina Genome Analyser con la finalidad de iniciar la secuenciación. Dentro de ella, cada cluster es suplido con polimerasa y nucleótidos que tienen su 3’OH químicamente inactivado, con la finalidad de incorporar solo una base por ciclo. De esta forma cada base que se incorpora en cada cluster es registrada por la plataforma. Este proceso se repite por cada nucleótido. Al final de cuatro días aproximadamente, la secuencia de cada cluster es registrada llevándose a cabo los subsecuentes análisis de resultados.
Secuenciación por Síntesis: Illumina 1. Se fragmenta el DNA. Se reparan los extremos. Se agregan los adaptadores. 2. Se agrega el DNA a la placa y se hibrida aleatoriamente con los adaptadores que están en la placa. 3. Se agregan NTPs sin marcar y DNA polimerasa. Comienza la amplificación. 4. Se desnaturaliza el DNA y se vuelve a realizar la amplificación puente. Se han generado millones de Clusters en la placa. 5. Se agregan los dNTPs, cada uno posee un fluoroforo de color particular: G(amarillo), C(azul), A(rojo) y T(verde). Se hace incidir un haz de laser y se captura la imagen. La imagen capturada en una posición especifica corresponde al primer nucleótido. 6. Los ciclos de secuenciación se repiten hasta determinar la secuencia. Una base a la vez. Productos: Sistemas HiSeq 1000- 300 Gb /2000- 600 Gb * Capacidad de generación de datos actual de 300 Gb para el HiSeq 1500 y 600 Gb para el HiSeq 2500 en ~11 días, lo que equivale a 3 y 6 genomas humanos completos respectivamente * El HiSeq 2500 está equipado con un sistema de celda de flujo dual. Así, puede secuenciar una o dos celdas de flujo con diferentes longitudes de lectura a la vez e iniciar y detener los experimentos de forma independiente. * El HiSeq 1500 y 2500 pueden procesar en una corrida múltiples lotes de muestras con alto rendimiento o correr menor cantidad de muestras para estudios rápidos (rapid run). En el modo rapid run el HiSeq 1500 genera 60 Gb en ~27
horas, mientras que el HiSeq 2500 en la misma cantidad de tiempo produce 120 Gb. * Lectura paired-end de 2 × 50 pb con calidad esperada de Q30 (1 error cada 1000 bases) entre el 85 a 95% de las bases leídas durante la secuenciación. En el caso de lecturas paired-end de fragmentos de 2 × 100 pb el porcentaje varía entre 80 a 90% de bases por encima de Q30.
BIBLIOGRAFÍA
Mardis, E. R. The impact of next-generation sequencing technologies on genetics. Trends in Genetics 24 N0.3: 133-141 http://medmol.es/tecnicas/85/ http://gtc.soe.ucsc.edu/content/solid-technology-overview http://www.appliedbiosystems.com