Machine learning algorithms to improve risk prediction models in healthcare
Professor Advisor
dc.contributor.advisor
Ríos Pérez, Sebastián
Author
dc.contributor.author
Wolff Rojas, Patricio Antonio
Associate professor
dc.contributor.other
Graña Romay, Manuel
Associate professor
dc.contributor.other
Martínez Cea, Diego
Associate professor
dc.contributor.other
Sauré Valenzuela, Denis
Admission date
dc.date.accessioned
2020-03-04T13:06:06Z
Available date
dc.date.available
2020-03-04T13:06:06Z
Publication date
dc.date.issued
2019
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/173473
General note
dc.description
Tesis para optar al grado de Doctor en Sistemas de Ingeniería
es_ES
Abstract
dc.description.abstract
Actualmente, se utiliza una gran cantidad de modelos de riesgo en diferentes instituciones de salud. Las herramientas de Machine Learning (ML) pueden ser utilizadas para automatizar estos procesos y mejorar los resultados de estos modelos. Estos modelos pueden incorporarse en procesos clínicos a través de sistemas conocidos como Clinical Decision Support Systems (ML-CDSS). Se seleccionaron tres problemas diferentes, que son parte de estos ML-CDSS: reingresos hospitalarios, triage de urgencia y descompensación de pacientes hospitalizados. Una de las características más importantes de estos tres problemas es que se centran en evaluar el nivel de riesgo para tomar decisiones y de esta forma adaptar el nivel de atención al nivel de riesgo determinado. Los tres problemas también se caracterizan por requerir el nivel de riesgo de un paciente, en un momento específico. Los tres problemas seleccionados son reconocidos en la literatura internacional como difíciles de resolver, particularmente en pediatría, por lo que, actualmente hay un gran interés en investigar en esta área.
Esta tesis pretende ser una contribución metodológica en el estado del arte de los algoritmos de ML aplicados a los problemas de riesgo de pacientes.
Para lograr nuestro objetivo, se debe implementar una serie de operaciones, que incluyen la limpieza de datos erróneos, etiquetado de datos, aplicar técnicas de balanceo de clases, probar diferentes modelos de clasificación y evaluar el desempeño de estos. Se llevaron a cabo varios estudios que muestran que es posible mejorar la predicción del riesgo y la clasificación de varias clases utilizando un enfoque de ML. En estos problemas, tanto la evaluación del desempeño como las etiquetas que permiten entrenar los modelos, se basan en resultados clínicos. Esto permite utilizar un conjunto de datos más grande y garantiza la objetividad del resultado, al limitar la influencia del juicio humano. En esta tesis se trabajó con datos anonimizados del hospital pediátrico Exequiel González Cortés.
El uso correcto de las herramientas de ML permite mejorar el resultado predictivo en problemas relacionados con el riesgo del paciente. Los excelentes resultados obtenidos con diferentes métricas de evaluación en problemas de predicción de riesgos permiten la validación metodológica de las herramientas de ML utilizadas. Incluso si se comparan con otros métodos knowledge-based y non-knowledge-based. Esto permite enriquecer la discusión sobre los beneficios de estos modelos en entornos clínicos reales. La metodología presentada en cada problema tiene, en términos generales, características similares y puede utilizarse en otros CDSS.