Predicción del riesgo de deserción de estudiantes de primer año de ingeniería civil industrial en una institución de educación superior utilizando técnicas de Machine Learning
Access note
Acceso abierto
Publication date
2024Metadata
Show full item record
Cómo citar
Bustos Cárdenas, Benjamín
Cómo citar
Predicción del riesgo de deserción de estudiantes de primer año de ingeniería civil industrial en una institución de educación superior utilizando técnicas de Machine Learning
Author
Professor Advisor
Abstract
La problemática de la deserción universitaria se ha vuelto un desafío prioritario para las instituciones de educación superior y entidades gubernamentales de Chile. Esta problemática de abandono presenta complejas y diversas causas, que van desde dificultades económicas, sociales, familiares, vocacionales y tambien de salud. A pesar de la implementación de planes y medidas para abordar estas causas, no se ha logrado disminuir de manera efectiva las cifras de deserción universitaria.
El objetivo del presente proyecto de tesis es proporcionar la capacidad de detección del riesgo de deserción universitaria en estudiantes de primer año de Ingeniería Civil Industrial a través de una herramienta de predicción diseñar e implementar una herramienta de predicción. Esta herramienta utilizará características demográficas y de rendimiento escolar de estudiantes de ingreso a la carrera de Ingeniería Civil Industrial de la Universidad de La Frontera. Su objetivo principal es que la Universidad posea la capacidad de detectar a los estudiantes con riesgo de deserción y pueda brindar apoyos oportunos, para evitar que abandonen sus estudios antes de finalizar su primer año académico en la institución.
Para llevar a cabo el proyecto de tesis, se utilizó aproximadamente $n$=1.100 registros de estudiantes de ingreso a la carrera de Ingeniería Civil Industrial de la Universidad de La Frontera entre los años 2015 y 2021 respectivamente. Estos datos fueron previamente analizados y preprocesados para ser clasificados mediante diferentes modelos de machine learning. Dichos modelos emplearon algoritmos de aprendizaje supervisado, tales como K-nearest neighbors, Support Vector Machine, Random Forests, entre otros.
Los resultados obtenidos, revelaron que es posible proporcionar la capacidad de detectar a estudiantes con riesgo de deserción con métricas de clasificación altas y prometedoras, utilizando un modelo de clasificación basado en el algoritmo de Random Forest. Se encontró que el primer atributo más importante para la predicción es el generado durante los dos primeros semestres académicos del estudiante, específicamente las asignaturas inscritas y aprobadas. En segundo lugar se encontraron los atributos de rendimiento escolar, como el Promedio NEM, el Puntaje PSU, entre otros relacionados también importantes a la hora de la clasificación.
Finalmente, también se identificó que el modelo de clasificación seleccionado mostró cifras considerables de falsos positivos y negativos. Estos aspectos deben ser tomados en cuenta en una posible aplicación real de la herramienta.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al Grado de Magíster en Tecnologías de la Información
Patrocinador
ANID /Subdirecci´on de Capital Humano
/Mag´ıster Nacional/2021 - 22210797
Collections
The following license files are associated with this item: