Métodos y aplicaciones para el análisis funcional en bioinformática
- Vázquez García, Miguel
- Juan Luis Pavón Mestras Director
- Alberto Pascual Montano Director
Defence university: Universidad Complutense de Madrid
Fecha de defensa: 14 July 2010
- Gonzalo Pajares Chair
- Javier Arroyo Gallardo Secretary
- Carlos Óscar Sánchez Sorzano Committee member
- Pedro Larrañaga Múgica Committee member
- Angel Rubio Díaz-Cordovés Committee member
Type: Thesis
Abstract
Esta tesis tiene como objetivo principal desarrollar métodos para el análisis funcional de resultados de experimentos de alto rendimiento, y acompañar estos métodos de aplicaciones útiles y fáciles de usar por los investigadores. En concreto, se busc a desarrollar métodos enmarcados dentro de las tres alternativas descritas en la sección anterior: enriquecimiento de anotaciones en bases de datos biológicas, minería de texto de artículos de biomedicina, y meta-análisis usando repositorios de datos de microarrays de expresión génica. Los objetivos planteados han sido alcanzados mediante el desarrollo de tres aplicaciones: * GeneCodis: Una aplicación para el análisis de enriquecimiento de co-anotaciones para diversas bases de datos. El aná lisis no se basa solo en buscar anotaciones sobre-representadas, sino también en buscar combinaciones de estas. La aplicación ofrece un rico interfaz web que presenta los datos en diversos formatos, incluyendo tablas y gráficos. * SENT: Una aplicaci ón de minería de textos que, dada una lista de genes, los agrupa basándose en la distribución de las palabras que aparecen en el conjunto de artículos asociados a cada gen. Estos grupos, además, vienen acompañados de una colección de palabras que ind ican aquellas características descritas en dichos artículos que justifican este agrupamiento. Adicionalmente, incluye una herramienta para explorar los artículos ordenados de acuerdo a su relevancia respecto a estas características. * MARQ: Una apli cación de meta-análisis que ofrece una base de datos de firmas de expresión, es decir, descripciones someras de patrones de expresión diferencial, para un repositorio de datos de microarrays que contiene gran parte de los datasets de ``The Gene Expre ssion Omnibus'' para 5 organismos modelo. La herramienta permite recuperar aquellas firmas que son más parecidas a la firma especificada como query en la aplicación, y, adicionalmente, ofrece funcionalidades de meta-análisis, tal y como se describía en la sección de objetivos. Para el desarrollo de la aplicación SENT se hace uso de la aplicación BioNMF, que ofrece la funcionalidad de análisis de factorización no negativa de matrices en un entorno de alto rendimiento, y que fue integrada tambié n en la infraestructura de servicios web