Implementación de modelos de clasificación en cáncer basados en datos mutacionales y clínicos
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Olivera Nappa, Álvaro
Cómo citar
Implementación de modelos de clasificación en cáncer basados en datos mutacionales y clínicos
Author
Professor Advisor
Abstract
El cáncer es la segunda causa principal de muerte en el mundo, generando 9.6 millones de decesos durante 2018. Ésta es una enfermedad compleja que combina tanto factores epigenéticos como genéticos. Actualmente, se han identificado varios factores de riesgo en cáncer; uno de los más importantes es el consumo de cigarrillo o tabaco. El consumo de este compuesto está asociado positivamente por lo menos a 13 tipos de cáncer, destacando en cáncer de hígado, riñón, vejiga y páncreas, entre otros. Sin embargo, pocos estudios han profundizado la relación entre generación de mutaciones somáticas y el consumo de cigarrillo, y cómo ésta afecta la propagación del cáncer a otros tejidos u órganos. En el primer capítulo de este trabajo se analizó la relación entre las variables clínicas, como el fumar cigarrillo, el subtipo tumoral, el subtipo histológico y la edad, con el número de mutaciones en pacientes con cáncer de pulmón. Encontramos que fumar cigarrillo aumenta de forma significativa el número de mutaciones con respecto a pacientes que nunca han fumado. Además, encontramos que los pacientes fumadores con Adenocarcinoma de Pulmón poseen una mayor cantidad de mutaciones, a diferencia de los pacientes con Carcinoma de Células Escamosas de Pulmón, en el cual no varía el número de mutaciones con los tipos de fumadores. Finalmente, usamos las variables clínicas junto con el número de mutaciones somáticas, que llamamos Carga Mutacional Total (Total Mutational Load) para clasificar el estado metastásico en los pacientes con cáncer de pulmón mediante modelos clasificatorios de Random Forest. Como principal hallazgo destacamos que la carga mutacional, el fumar cigarrillo y el grado tumoral contribuyen de una forma importante la clasificación de metástasis en pacientes con cáncer de pulmón.
Por otro lado, en el segundo capítulo de esta tesis, se aborda la clasificación del cáncer primario, dado que en cerca del 2% de la población con cáncer no se logra definir el órgano de origen del cáncer, lo que interfiere con la aplicación de terapias efectivas para estos pacientes. En este trabajo se analizó el poder predictivo de la acumulación de los distintos tipos de mutaciones somáticas, tales como SNVs, indels y SVs, para clasificar 33 tipos tumorales mediante modelos de clasificación Random Forest en 2653 pacientes provenientes del Pan-Cancer Analysis of Whole Genomes (PCAWG) Consortium. Como principal resultado obtuvimos que los patrones de SNVs permiten clasificar con una alta precisión la mayoría de los tipos tumorales evaluados. Esto indica que existen señales mutacionales específicas en los órganos que originan los tumores.
General note
Tesis para optar al grado de Doctor en Ciencias de la Ingeniería, Mención Ingeniería Química y Biotecnología
Identifier
URI: https://repositorio.uchile.cl/handle/2250/180612
Collections
The following license files are associated with this item: