Título: Análisis, adaptación y comparación de métodos estadísticos de predicción de hotspots y aplicación en el ámbito de las cardiopatías familiares.
Autor: García Zarzoso, Alba
Resumen: [ES] Los hotspots son regiones del ADN susceptibles a presentar variaciones genéticas por distintas razones biológicas e identificarlas es crucial para la medicina de precisión y el diagnóstico precoz de las enfermedades. Sin embargo, estas regiones no se suelen reportar y, por tanto, su predicción sigue siendo un desafío. Por este motivo, el objetivo de este Trabajo Final de Máster es analizar, adaptar y comparar distintos métodos predictivos de hotspots basados en la estadística dentro del ámbito de las cardiopatías familiares. El estudio se divide en 5 etapas: (1) Revisión bibliográfica y selección de métodos, (2) Generación de los datos de entrada, (3) Análisis teórico de los métodos seleccionados, (4) Adaptación de los datos de entrada a cada método e (5) Implementación de métodos. Los resultados se comparan con una base de datos de referencia en este dominio llamada CardioHotspots mediante métricas de evaluación. El método con mejor desempeño es el asociado al algoritmo Smith Waterman y muestra una sensibilidad del 33,33 %, una especificidad del 92,22% y una exactitud del 68,71 %. Estos resultados revelan que todavía queda mucho margen de mejora dentro de este área de estudio y resalta la necesidad de continuar investigando estos métodos predictivos de hotspots.[EN] Hotspots are DNA regions susceptible to genetic variations for different biological reasons and identifying them is crucial for precision medicine and early diagnosis of diseases. However, these regions are not often reported and, therefore, their prediction remains a challenge. For this reason, the aim of this Master's Thesis is to analyze, adapt and compare different statistical-based hotspot prediction methods in the field of familial heart disease. The study is divided into 5 stages: (1) Literature review and method selection, (2) Generation of input data, (3) Theoretical analysis of the selected methods, (4) Adaptation of input data to each method and (5) Implementation of methods. The results are compared with a reference database in this domain called CardioHotspots using evaluation metrics. The best performing method is the one associated with the Smith Waterman algorithm, showing a sensitivity of 33.33%, a specificity of 92.22% and an accuracy of 68.71%. These results reveal that there is still much room for improvement within this area of study and highlight the need to continue researching these hotspot predictive methods.