Redes de interacción molecular como herramienta para mejorar el cálculo de puntajes de riesgo poligénico y su aplicación en cáncer de mama
Tesis
Access note
Acceso abierto
Publication date
2022Metadata
Show full item record
Cómo citar
Ramos Henriques Maracajá Coutinho, Vinicius
Cómo citar
Redes de interacción molecular como herramienta para mejorar el cálculo de puntajes de riesgo poligénico y su aplicación en cáncer de mama
Author
Professor Advisor
Abstract
El cáncer de mama (CM) es el cáncer más común en mujeres. A nivel nacional e internacional representa cerca del 15% de la mortalidad por cáncer en población femenina, resultando en un importante problema de salud pública. La forma óptima de abordarlo es el diagnóstico temprano, mediante métodos de tamizaje. La detección de factores de riesgo para el CM identificados (i.e, sexo, edad, historia familiar y factores hormonales) permiten un uso óptimo de los recursos de tamizaje, estos factores dependen directamente de la genética y los cambios en ella para cada individuo. A nivel genético, se identifican genes de susceptibilidad para el CM, que al presentar ciertas mutaciones generan alta predisposición. Sin embargo, estas mutaciones son de baja frecuencia, existiendo otras variantes genéticas de mayor frecuencia con menor efecto individual en el riesgo de CM, pero que permiten la acumulación de efectos patogénicos en la población. Estas variantes son detectables en estudios de asociación de genoma completo (GWAS), aunque no son capaces de detectar directamente todas las variantes causales, permiten la derivación de puntajes de riesgo poligénico (PRS) mediante el procesamiento de un efecto estimado de las variantes genéticas en GWAS. Los PRS captaron la atención del área biomédica y comercial, pero aún presentan margen de mejora. La teoría Omnigénica postula que la interconexión entre vías de regulación es suficiente para que todos los genes expresados afecten al desarrollo de la patología en tejidos relevantes para esta, sugiriendo que integrar el efecto de variantes genéticas obtenidas de GWAS, junto a las interacciones moleculares de las regiones que las contienen a nivel de RNA y/o proteína, podrían mejorar el rendimiento de los PRS. En este trabajo, hipotetizamos que “la integración de redes de interacción molecular, generadas en base a variantes genéticas asociadas a cáncer de mama, mejoran el rendimiento de puntajes de riesgo poligénico en la predicción de riesgo de la enfermedad”. Para validar esta hipótesis, se trabajó con los siguientes objetivos: (i) selección y análisis de variantes genéticas conocidas y asociadas a CM, mediante su importancia a nivel estadístico poblacional; (ii) determinación de las redes de interacción molecular características de los genes o regiones en que se localizan las variantes genéticas seleccionadas; (iii) generación de un nuevo modelo de puntajes de riesgo poligénico para CM, a partir de una estrategia de priorización de genes vecinos dentro de las redes de interacción. En el desarrollo del trabajo, utilizamos herramientas bioinformáticas, bases de datos, además de información a nivel genómico y transcriptómico caso/control para CM, para la derivación de un puntaje poligénico integrativo. Se obtuvo un rendimiento predictivo con tendencia al aumento, levemente superior no significativo, al integrar la información de redes de interacción obtenida en los 2 modelos generados. Se concluye que los resultados mostraron cierta relación entre la interacción molecular de genes expresados en tejido mamario y un mejor PRS, pero son necesarios datos de mejor calidad, para un enfoque más específico y robusto. Breast cancer (BC) is the most common cancer in women. Both in Chile and worldwide, it represents about 15% of cancer mortality in the female population, resulting in a major public health problem. The optimal way to address it is early diagnosis, by using screening methods. The detection of identified risk factors for BC (i.e., sex, age, family history and hormonal factors) allow optimal use of screening resources, these factors depend directly on genetics and changes in it for each individual. At the genetic level, susceptibility genes for BC were identified in families at risk, which when presenting certain mutations generate high predisposition (monogenic effects). However, these mutations are rare, and large combinations of variants of higher frequency and smaller individual variant effect sizes on the risk of BC, but that allow the distribution of pathogenic effects in the population. These variants and respective effects are detected in genome-wide association studies (GWAS), although they are not able to directly detect causal variants of the disease, they allow the derivation of polygenic risk scores (PRS) by processing an estimated effect of the genetic variants in GWAS. The PRS captured the attention of the biomedical and commercial area, but still have room for improvement. The Omnigenic theory postulates that the interconnection between regulatory pathways is sufficient for all the genes expressed to affect the development of pathology in tissues relevant to it, suggesting that integrating the effect of genetic variants obtained from GWAS, together with the molecular interactions of the regions that contain them at the level of RNA and / or protein, could improve the performance of PRS. In this work, we hypothesized that "the integration of molecular interaction networks, generated based on genetic variants associated with breast cancer, improves the performance of polygenic risk scores in the prediction of disease risk." To validate this hypothesis, we worked with the following objectives: (i) selection and analysis of genetic variants known and associated with BC, through their importance at the population statistical level; (ii) determination of the molecular interaction networks characteristic of the genes or regions in which the selected genetic variants are located; (iii) generation of a new model of polygenic risk scores for BC, based on a strategy of prioritization of neighboring genes within interaction networks. In the development of the work, we used bioinformatics tools, databases, as well as information at the genomic and transcriptomic case/control level for BC, for the derivation of an integrative polygenic score. A predictive performance with a slightly higher non-significant tendency to increase was obtained when integrating the interaction network information obtained in the 2 generated models. It is concluded that the results showed some relationship between the molecular interaction of genes expressed in breast tissue and a better PRS, but better quality data are needed, for a more specific and robust approach.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis Magister en Bioquímica área de Especialización en Clínica Memoria para optar al título de Bioquímico
Patrocinador
FONDECYT Regular (1211731) y FONDAP (15130011) ; Concurso Enlace Fondecyt 2020 (I0230/2020); y finalmente, al Concurso Apoyo a la Infraestructura para la Investigación 2019 (INFRA-021/01/2019) de la Vicerrectoría de Investigación y Desarrollo (VID) de la Universidad de Chile
Collections
The following license files are associated with this item: