Bioinformática aplicada a datos genómicos para la caracterización de subtipos de cáncerestudios integrativos en hemopatías malignas

  1. Aibar Santos, Sara
Supervised by:
  1. Javier de las Rivas Sanz Director

Defence university: Universidad de Salamanca

Fecha de defensa: 25 May 2015

Committee:
  1. Jesús María Hernández Rivas Chair
  2. Manuel Martín-Merino Acera Secretary
  3. Angel Rubio Díaz-Cordovés Committee member

Type: Thesis

Abstract

[ES]En los últimos años, el uso de datos ómicos, como los basados en microarrays o secuenciación, está creciendo muy rápidamente en la investigación en biomedicina. Estos datos permiten estudiar las enfermedades desde un punto de vista biomolecular que anteriormente no estaba disponible. Con ello, ofrecen grandes oportunidades para mejorar tanto la comprensión de la enfermedad, como el desarrollo de nuevos métodos de base molecular para el diagnóstico, pronóstico y tratamiento de los pacientes. Sin embargo, para explorar en detalle la cantidad tan enorme de datos producidos por las tecnologías ómicas, es indispensable la aplicación de técnicas avanzadas de análisis y cálculo computacional que permitan extraer la información biológica disponible en ellos. Para ello, la bioinformática ayuda a manejar, integrar y analizar las cantidades enormes de datos biológicos y moleculares para transformarlos en información estructurada y organizada, de forma que pueda ser más fácilmente comprensible. El objetivo de ésta Tesis Doctoral es el desarrollo de nuevas metodologías basadas en técnicas de inteligencia artificial y minería de datos para caracterizar subtipos de enfermedades, especialmente de cáncer, a través del análisis de datos genómicos y transcriptómicos de muestras humanas. Para ello, ésta Tesis se ha centrado principalmente en dos enfoques: Por un lado el desarrollo de dos herramientas bioinformáticas y por otro, dos estudios concretos de muestras de síndromes mielodisplásicos (MDS). Las dos herramientas bioinformáticas, presentadas en los capítulos 1 y 2, se corresponden con dos paquetes de R, disponibles en Bioconductor, y se presentan a través de las publicaciones asociadas. El primero de ellos, geNetClassifier, es principalmente una herramienta para estudiar los perfiles de expresión de subtipos de enfermedades relacionadas en un contexto común. Permite identificar los genes que están alterados en cada una de los subtipos, bien para identificarlos como posibles marcadores, o bien para estudiar los procesos subyacentes, alterados en la enfermedad. La otra herramienta, Functional Gene Networks (FGNet), facilita el análisis de las listas de genes provenientes de estudios ómicos. Permite realizar el análisis de enriquecimiento funcional de la lista y posteriormente transforma los resultados del análisis en una red para su análisis numérico, visualización y exploración más a fondo. Por otro lado, para el desarrollo de nuevos métodos bioinformáticos de análisis de datos derivados de estudios biomédicos, es importante estar en contacto con grupos clínicos que posean datos complejos asociados a problemas y cuestiones concretas que tengan relevancia en el campo. Por ello, en los capítulos 3 y 4 se realizan análisis de datos de síndromes mielodisplásicos (MDS). Un grupo de enfermedades muy heterogéneo, que afecta a la correcta producción de células sanguíneas, y frecuentemente acaban derivando en leucemia. El capítulo 3 presenta el trabajo bioinformático llevado a cabo para realizar el análisis combinado de datos de expresión y de metilación. Éste análisis fue parte en un estudio colaborativo para caracterizar las alteraciones en los perfiles de expresión y metilación del ADN en pacientes de síndromes mielodisplásicos de bajo riesgo. Por un lado, identificando hasta qué nivel estaba alterada la metilación del ADN a escala global del genoma en los pacientes de MDS, y por otro, cómo podían afectar estar afectando esas alteraciones a la expresión. De éste modo, se pudieron identificar de varios genes clave en la patología de los MDS cuya expresión podía estar alterada por cambios en su metilación. El capítulo 4 se muestra la metodología llevada a cabo para estudiar los perfiles de expresión de los síndromes mielodisplásicos en su progresión hacia la leucemia. En éste estudio integrativo, de datos procedentes de distintos estudios y plataformas, se pudieron identificar grupos de genes con patrones de expresión similares en la progresión hacia la leucemia, entre los que se encuentran algunos posibles reguladores. A través de éstos trabajos, se proponen distintas metodologías para el estudio de subtipos de enfermedades. Éstos estudios se puede centrar tanto en identificar los genes y características que diferencian las patologías, como las que tienen en común. Los genes con un perfil único en cada estado son interesantes como posibles biomarcadores de la enfermedad y ayudan a conocer los procesos subyacentes en los distintos estadíos. Por otro lado, las características en común dan la posibilidad de obtener una visión global del desarrollo y de su posible progresión en distintas fases.