Modelo de predicción de fuga de clientes en empresa SaaS de inteligencia logística
Tesis
Access note
Acceso abierto
Publication date
2021Metadata
Show full item record
Cómo citar
Puente Chandía, Alejandra
Cómo citar
Modelo de predicción de fuga de clientes en empresa SaaS de inteligencia logística
Author
Professor Advisor
Abstract
En estos tiempos donde procesos y la forma en que nos relacionamos se está trasladando a
lo digital, donde se espera que el mercado latinoamericano de tecnología de la nube crezca en
un 250 % en 3 años a partir de 2021 [Vota et al., 2020], empresas SaaS enfrentarán cada día
más competencia, aumentando con esto su riesgo de perder clientes. En este escenario, contar
con herramientas que permitan anticiparse a una fuga se vuelve cada vez más relevante.
Esta memoria aborda la elaboración de un modelo de predicción de fuga de clientes y la
interpretación de variables relevantes, en una empresa de inteligencia logística, con el objetivo
de aportar con una herramienta a la organización. Esto se llevó a cabo utilizando técnicas de
machine learning (XGBoost y Logit), interpretación de coeficientes de Logit y el análisis de
shap values para la interpretación del efecto de variables en el modelo XGBoost. Vale destacar
que para realizar este trabajo que se utilizó con una base de datos de 2372 instancias y 7
variables relevantes para la predicción.
Los resultados de este estudio indican que el modelo XGBoost tiene un mejor desempeño
en la predicción de fuga para este contexto (AUC = 0.76, precisión = 0.22, sensibilidad =
0.56) en comparación con el modelo logit (AUC = 0.72, precisión = 0.04,sensibilidad = 0.76).
Por otro lado, en cuanto a la interpretación de variables, el análisis de shap values permitió
identificar que en los primeros 7 meses de actividad, los clientes son más propensos a la fuga, y
que usuarios que registran niveles bajos en una de las variables que miden la frecuencia de uso
( n_planes_mes ) tienden también a tener una probabilidad de fuga mayor. De esta última
variable se destaca la capacidad de ser utilizada como clasificador simple a través de un árbol
de decisión, donde clientes cuyas métricas estén bajo cierto umbral son clasificados como
candidatos a la fuga, alcanzando un performance cercano al del modelo XGBoost (precisión
= 0.14, sensibilidad = 0.55) con una implementación más sencilla.
En conclusión, los resultados muestran que el modelo XGBoost es el que logra la mejor
predicción con los datos disponibles. Por su parte, el estudio de los shap values no solo
permitió entender como cada variable influye en la predicción, sino que además contribuyó a
generar preguntas como por ejemplo el por qué en los primeros 7 meses se tiene una mayor
propensión a la fuga, cuya respuesta podría ayudar a generar estrategias efectivas de retención
de cliente y que se propone investigar en trabajos futuros.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/183445
Collections
The following license files are associated with this item: