Computational analysis of alternative splicinga novel algorithm to predict context-specific splicing factors and a statistical web application for precisión medicine in cancer
- Carazo Melo, Fernando José
- Angel Rubio Díaz-Cordovés Director
- Francisco Javier Planes Pedreño Codirector
Universidad de defensa: Universidad de Navarra
Fecha de defensa: 12 de abril de 2019
- Luis Montuenga Badía Presidente
- David Otaegui Bichot Secretario/a
- Arkaitz Carracedo Pérez Vocal
- Kevin F. Brennan Vocal
- Ana Maria Aransay Bañares Vocal
Tipo: Tesis
Resumen
El splicing alternativo (AS) aberrante desempeña un papel fundamental en el desarrollo del cáncer. Específicamente, todas las características del cáncer (angiogénesis, inmortalidad celular, evitar la respuesta del sistema inmunitario, etc.) tienen una contrapartida en el empalme aberrante de algunos genes. En los últimos años, el AS se ha utilizado como un biomarcador de pronóstico, un biomarcador de respuesta de terapia e incluso como diana terapéutica. Sin embargo, debido a la complejidad de analizar el transcriptoma, la comunidad científica no ha explotado suficientemente este valioso recurso en medicina de precisión. Los factores de splicing (SF) y otras proteínas de unión a ARN (RBP) son los principales reguladores del proceso AS. Predecir los SF específicos en una condición concreta proporcionaría información valiosa para descifrar las reglas de regulación de AS. Los sitios de unión específicos de los SF pueden medirse utilizando experimentos de inmunoprecipitación (CLIP). Sin embargo, para descubrir qué SFs regulan una condición, es necesario tener una hipótesis a priori, ya que los experimentos CLIP están dirigidos a una única proteína. Esta tesis está dividida en tres secciones principales. La primera sección incluye una revisión de metodologías previas para predecir SFs. Los modelos computacionales para identificar estos reguladores no son triviales y requieren tres pasos conceptuales: la detección de eventos de splicing, la identificación de los sitios de enlace de SF que potencialmente regulan estos eventos y la contextualización de estos datos para un experimento específico. En esta sección, se discuten las principales debilidades y fortalezas de los tres pasos de la metodología. Además, se detalla un caso práctico para mostrar el potencial y las limitaciones de este enfoque computacional. En la segunda sección, se propone una metodología novedosa que utiliza experimentos CLIP para predecir los SF activos que modulan el AS en un experimento, utilizando RNA-seq o microarrays. Esta tarea requiere recopilar, integrar y analizar más de 900 experimentos CLIP. Esta metodología se ha validado en cuatro experimentos controlados en los que se inhibió un SF usando ARN de interferencia. En estos experimentos fue posible predecir correctamente los SFs utilizando la metodología propuesta. Además, se proporciona una base de datos unificada de experimentos CLIP. El tutorial con el código fuente y los datos integrados está disponible online en https://gitlab.com/fcarazo.m/sfprediction. En la tercera sección, se presenta TranscriptAchilles, una herramienta computacional que explota la expresión de genes e isoformas como biomarcadores de la esencialidad genética en el contexto del cáncer. Esta aplicación integra 412 experimentos de ARN de interferencia de >17,000 genes junto con su correspondiente perfil de expresión transcripcional. Usando esta herramienta, hemos estudiado cuáles son los subtipos de cáncer para los cuales la AS juega un papel importante para identificar la esencialidad genética. Además, se presenta un caso práctico en carcinoma de células renales que muestra la solidez biológica de los resultados. Las bases de datos, el código fuente y una guía para construir la plataforma dentro de un contenedor Docker están disponibles en GitLab (https://gitlab.com/fcarazo.m/transcriptAchilles.git/). TranscriptAchilles también está disponible públicamente en el servicio de entorno de nube de Amazon Web Services en la URL: http://biotecnun.unav.es:8080/app/TranscriptAchilles.