Detección temprana de riesgo cardiovascular usando text mining en los campos de texto no estructurado del registro clínico electrónico
Tesis
Publication date
2014Metadata
Show full item record
Cómo citar
Velásquez Silva, Juan
Cómo citar
Detección temprana de riesgo cardiovascular usando text mining en los campos de texto no estructurado del registro clínico electrónico
Professor Advisor
Abstract
Objetivo: Generar un modelo predictivo, basado en Machine Learning (ML) y Natural Language Processing (NLP), que a partir de signos y síntomas detectados en los campos de texto no estructurados del Registro Clínico Electrónico, pueda predecir niveles altos de riesgo cardiovascular de una persona.
Contexto: Detectar con anticipación el riesgo cardiovascular podría mejorar de gran manera el bien estar de las personas y disminuir los costos asociados su tratamiento. Actualmente, se usa el criterio de Framingham para detectar riesgo cardiovascular.
Problema: El médico puede utilizar muy poco tiempo en un paciente en la atención primaria de salud pública, por lo que no puede "sintetizar" toda la información de la historia clínica para evaluar el riesgo cardiovascular. Además, hay una tendencia a la baja en la cobertura de de los programas preventivos, donde se aplica el formulario Framingham. Luego, existe una alta probabilidad que a un gran número de personas no se les comunique a tiempo su nivel alto de riesgo cardiovascular.
Hipótesis: Existe información valiosa en los campos de texto no estructurado del registro clínico electrónico, para detectar de forma temprana Riesgo Cardiovascular.
Diseño: Se propone sintetizar de forma automática los registros de todas las atenciones de un paciente, y detectar los signos y síntomas registrados en los campos de texto no estructurado del registro clínico electrónico que permita evaluar y predecir el riesgo cardiovascular de una persona aplicando técnicas de minería de datos (text mining). Se calibró un modelo Logistic Regression, para realizar la predicción sobre Riesgo Cardiovascular.
Resultado: Se evaluó el desempeño del modelo de acuerdo a la medida AUC= 0.968 y F-Measure= 88.6%. Además, se agrega valor al detectar riesgo cardiovascular en personas que no pertenecen al PSCV o estaban clasificados con nivel de riesgo moderado o bajo.
Conclusión: Es posible validar que existe información valiosa en los campos de texto no estructurado del registro clínico electrónico, que permite detectar de forma temprana el riesgo cardiovascular.
General note
Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/130804
Collections