Machine learning algorithms to improve risk prediction models in healthcare

Actualmente, se utiliza una gran cantidad de modelos de riesgo en diferentes instituciones de salud. Las herramientas de Machine Learning (ML) pueden ser utilizadas para automatizar estos procesos y mejorar los resultados de estos modelos. Estos modelos pueden incorporarse en procesos clínicos a través de sistemas conocidos como Clinical Decision Support Systems (ML-CDSS). Se seleccionaron tres problemas diferentes, que son parte de estos ML-CDSS: reingresos hospitalarios, triage de urgencia y descompensación de pacientes hospitalizados. Una de las características más importantes de estos tres problemas es que se centran en evaluar el nivel de riesgo para tomar decisiones y de esta forma adaptar el nivel de atención al nivel de riesgo determinado. Los tres problemas también se caracterizan por requerir el nivel de riesgo de un paciente, en un momento específico. Los tres problemas seleccionados son reconocidos en la literatura internacional como difíciles de resolver, particularmente en pediatría, por lo que, actualmente hay un gran interés en investigar en esta área. Esta tesis pretende ser una contribución metodológica en el estado del arte de los algoritmos de ML aplicados a los problemas de riesgo de pacientes. Para lograr nuestro objetivo, se debe implementar una serie de operaciones, que incluyen la limpieza de datos erróneos, etiquetado de datos, aplicar técnicas de balanceo de clases, probar diferentes modelos de clasificación y evaluar el desempeño de estos. Se llevaron a cabo varios estudios que muestran que es posible mejorar la predicción del riesgo y la clasificación de varias clases utilizando un enfoque de ML. En estos problemas, tanto la evaluación del desempeño como las etiquetas que permiten entrenar los modelos, se basan en resultados clínicos. Esto permite utilizar un conjunto de datos más grande y garantiza la objetividad del resultado, al limitar la influencia del juicio humano. En esta tesis se trabajó con datos anonimizados del hospital pediátrico Exequiel González Cortés. El uso correcto de las herramientas de ML permite mejorar el resultado predictivo en problemas relacionados con el riesgo del paciente. Los excelentes resultados obtenidos con diferentes métricas de evaluación en problemas de predicción de riesgos permiten la validación metodológica de las herramientas de ML utilizadas. Incluso si se comparan con otros métodos knowledge-based y non-knowledge-based. Esto permite enriquecer la discusión sobre los beneficios de estos modelos en entornos clínicos reales. La metodología presentada en cada problema tiene, en términos generales, características similares y puede utilizarse en otros CDSS.

General note

Tesis para optar al grado de Doctor en Sistemas de Ingeniería

Patrocinador

CONICYT-PCHA/ Doctorado Nacional/2015-21150115

Identifier

URI: https://repositorio.uchile.cl/handle/2250/173473

Collections