Computational and statistical approaches for genotype imputation, haplotype reconstruction and analysis of genome variation

  1. MEDINA RODRÍGUEZ, NATHAN
Dirigida por:
  1. Ana M. Wägner Director/a
  2. Jose María Quinteiro González Director/a
  3. Ángelo Santana del Pino Director/a

Universidad de defensa: Universidad de Las Palmas de Gran Canaria

Fecha de defensa: 29 de marzo de 2016

Tribunal:
  1. Juan Rocha Martín Presidente/a
  2. Jesús Bernardino Alonso Hernández Secretario/a
  3. Carlos Alberto Flores Infante Vocal
  4. Caroline Anna Brorsson Vocal
  5. Christian Theil Have Vocal

Tipo: Tesis

Resumen

El trabajo de esta tesis se ha basado fundamentalmente en la investigación y desarrollo de varias técnicas estadístico-computacionales orientadas a la resolución de algunos de los problemas que se plantean en el contexto del análisis de las grandes bases de datos que se utilizan actualmente en genética. Dicho trabajo ha permitido la obtención de interesantes resultados tanto con datos genéticos de origen poblacional como familiares. Inicialmente, en esta tesis se ha realizado una revisión muy completa de los métodos estadísticos en Genética y Bioinformática utilizados en la actualidad para evaluar la asociación entre el genoma y las enfermedades. Seguidamente, se han utilizado métodos computacionales avanzados para identificar variaciones genéticas relacionadas con fenotipos de interés en estudios de asociación genómica (GWAS, Genome-Wide Association Studies) y se ha elaborado un tutorial con instrucciones detalladas para la realización de dichos estudios de asociación, incluyendo procedimientos para el control de calidad de los datos, el alineamiento de secuencias, la imputación e identificación de la fase de genotipos, y el análisis de asociación estadístico. Tras la aplicación de los métodos correspondientes y el análisis de datos, se han identificado nuevas asociaciones de variantes genéticas asociadas a la nefropatía diabética avanzada de sujetos con diabetes tipo 2 (T2D) en la población de la isla de Gran Canaria. Por otro lado, también se ha desarrollado un paquete computacional en lenguaje R llamado (alleHap), que es capaz de imputar alelos e identificar (reconstruir) haplotipos de manera determinista e inequívoca en bases de datos familiares mediante el cruce de la información genotípica (no recombinante) entre padres e hijos. Finalmente, mediante la utilización del citado paquete bioinformático, se han identificado haplotipos de riesgo en la región genómica (HLA, Human Leukocyte Antigen) los cuales están incluidos en la base de datos (T1DGC, Type 1 Diabetes Genetics Consortium), se ha realizado un análisis de factores maternos asociados con el desarrollo precoz y en la infancia de la diabetes tipo 1, y se han comparado la frecuencia de los haplotipos de riesgo en una muestra de sujetos de las Islas Canarias con respecto a muestras del resto