Revista nº 802
136 Iván Morales Secuenciación masiva de genes de hipoacusia INTRODUCCIÓN La hipoacusia es una de las alteraciones sensoriales más frecuen- tes, afectando aproximadamente a uno de cada 500 nacimientos, y pu- diendo producirse de novo a cualquier edad en individuos sanos (1). Su etiología es diversa, pudiendo originarse tanto por factores medioam- bientales (ruido, virus o sustancias ototóxicas) como por factores gené- ticos. A diferencia de los factores medioambientales, que pueden ser reducidos o prevenidos a través de medidas de concienciación pública, la hipoacusia generada por un trasfondo genético sigue presentando grandes retos. Clínicamente, la hipoacusia se puede clasificar como sindrómica o no sindrómica dependiendo, respectivamente, de si se presenta junto a otro fenotipo clínico (discapacidad visual, enfermedad renal crónica…) o no. Las hipoacusias no sindrómicas son las más fre- cuentes,presentándoseen,aproximadamente,el70%deloscasos(2,3). Gracias a las técnicas de secuenciación masiva, como el análisis del exoma completo (WES), y al uso de estrictos protocolos de filtrado de variantes, se han identificado más de 100 loci relacionados con la hipoacusia no sindrómica (4-6). La identificación de variantes genéticas que causan el deterioro de la audición ha permitido un mejor conoci- miento de las vías moleculares que están involucradas en la regulación de la percepción auditiva. El conocimientode estas vías nos proporciona un punto de partida para el desarrollo de opciones terapéuticas para las personas afectadas por enfermedades relacionadas con la audición (7). La eficacia del WES y el filtrado de variantes es muy alta debido a que el 85% de las variantes causantes de enfermedades se encuentran en regiones exónicas (8). Además, el exoma solo representa 1-2% del genoma, lo que reduce considerablemente el coste económico y facili- ta el tratamiento de los datos (9). Como contrapartida, la cobertura del WES es del 90%, existiendo de esta manera regiones codificantes de di- fícil lectura de las que no se obtienen suficientes datos. Esto se debe a problemas inherentes a las estructuras secundarias que pueden adop- tar los exones o a su contenido de bases GC. Las estructuras de difícil lectura pueden deberse a repeticiones (ACC, CCG…), repeticiones Alu, regiones horquilla o bucles, colas poli-A/T y otros motivos que causan compresión en el ADN. Por otro lado, el contenido de GC mínimo que causa problemas aún no está claramente determinado, pero se sitúa en torno al 60-65% en regiones de al menos 100 pares de bases (10). Todo ello conlleva una enorme dificultad para secuenciar ciertos frag- mentos de ADN y da lugar a regiones en las que se ha perdido total o parcialmente la información. Por consiguiente, esto implica reanali- zar estas regiones con otras técnicas más precisas pero más costosas, como es el re-análisis del genoma completo o la secuenciación Sanger. La identificación de estas regiones in sílico puede prevenir la pérdida de regiones del genoma relevantes y que podrían incluir variantes can- didatas. Por tanto, el desarrollo de un protocolo de identificación de estas regiones es un paso crucial en la identificación variantes en las enfermedades poco frecuentes que puede concluir en investigaciones de alto impacto y una mejor comprensión de las bases biológicas de las enfermedades hereditarias (11). El objetivo de este estudio es diseñar un protocolo para la identificación de las secuencias nucleotídicas de baja cobertura (se- cuencias de muy difícil lectura) a partir de datos de secuenciación de exoma, particularmente en los genes dominantes relacionados con hipoacusia no sindrómica. MATERIALES YMÉTODOS Pacientes y secuenciación del exoma completo Cincuenta y cinco individuos (15 casos con enfermedad de Me- niere y 40 controles), fueron seleccionados para obtener muestras de sangre, realizar la extracción de ADN y la secuenciación del exo- ma completo (12-14). El ADN fue aislado a partir de sangre periférica mediante QIAamp DNA Mini Kit (Qiagen). Los exones y regiones cir- cundantes (UTR 3’ y 5’) fueron capturadas mediante el kit Agilent’s All Exon 50MB. Las condiciones y los cebadores empleados se encuentran disponibles en la casa comercial. Las muestras fueron secuenciadas en la plataforma SOLiD 5500xl . El alineamiento y el mapeo se realizó me- diante el uso del software Lifescope v2.5 y el genoma de referencia GRCh37/hg19 , dando lugar a un archivo .BAMpor individuo . Este estudio conmuestras biológicas humanas fue aprobado por el Comité de Ética de Investigación del Hospital y se siguieron los es- tándares éticos reconocidos por la Ley Biomédica de España (15) y los principios de la Declaración de Helsinki de 1975 (16). Todos los pacien- tes participantes en el estudio fueron informados de los objetivos del mismo y firmaron el consentimiento informado. Análisis bioinformático Análisis de exones en genes dominantes asociados a hipoacusia no sindrómica. Los archivos .BAM fueron visualizados en el software Integra- tive Genome Viewer (IGV) para detectar fallos de secuenciación en los exones de los 34 genes de hipoacusia no sindrómica autosómica dominante descritos en la base de datos de hipoacusia hereditaria (http://hereditaryhearingloss.org/) . Los exones fueron clasificados en 3 categorías según la calidad de su lectura: “Buena” para aquellos con una cobertura >20 lecturas (>20X); “Parcial” para una cobertura entre 5-20 lecturas (5-20X) y “Mala” para una cobertura <5 (<5X). Todos los exones que presentaban fallos de lectura en el 100 % de las muestras fueron comparados frente a las bases de datos ExAC y GnomAD (17). Los exones fueron numerados, siendo siempre el primero el de la iz- quierda obviando la dirección de la lectura del gen. Las secuencias que comprendían estos exones fueron analizadas mediante un script reali- zado ad hoc por el grupo de Otología y Otoneurología para estimar el número de bases que contenían. Para la búsqueda de estructuras se- cundarias en estas secuencias fue usada la herramienta virtual mfold (18). Estas estructuras fueron generadas bajo las condiciones presen- tes durante la secuenciación en la plataforma de secuenciación SOLiD 5500xl: 98ºC de temperatura y 3Mde concentración de sodio. RESULTADOS Genes dominantes causales de hipoacusia autosómica no sin- drómica En conjunto, los 34 genes de hipoacusia no sindrómica autosómi- ca dominante estudiados comprenden un total de 592 exones. Veinti- cuatro de estos exones, pertenecientes a 13 genes, presentan una baja cobertura. Los exones fueron clasificados como “Ilegibles” cuando un exón presentó baja cobertura en el 100% de las muestras ( Tabla 1-2 ). Los resultados muestran que genes muy destacados para la hipoacusia ( MYH14 , WFS1 y P2RX2 ) presentan mala cobertura en muchos de sus exones. Además, 20 de las 24 secuencias exónicas presentan un conte- nido de GCmás elevado del considerado como óptimo ( Tabla 2 - ver en la página 138 ). Las secuencias que alcanzaron los valores más elevados Results: Thirteen from the 34 genes involved in no syndromic autosomal dominant hearing loss had low coverage. Twenty from the 24 exonic sequences with low coverage had higher percentage of GC content than the optimal and all of them had one or more secondary structures. Genes with more exons with low coverage were: MYH14, WFS1 and P2RX2. Conclusions: 1. Whole Exome Sequencing shows that most of the non-syndromic autosomal dominant hearing loss genes had low coverage in some exons. 2. The analysis of the guanines and cytosines content, and the presence of secondary structures have determined specific sequences with read problems. 3. The results of Next Generation Sequencing must be validated to avoid possible false positives.
RkJQdWJsaXNoZXIy ODI4MTE=