Diseño y desarrollo de un modelo predictivo de fuga para un segmento de clientes en el mercado de foodservice en Agrosuper S.A. utilizando herramientas de Machine Learning
Tesis
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Álvarez Gómez, Héctor
Cómo citar
Diseño y desarrollo de un modelo predictivo de fuga para un segmento de clientes en el mercado de foodservice en Agrosuper S.A. utilizando herramientas de Machine Learning
Professor Advisor
Abstract
La fuga de un cliente es una situación que se quiere evitar en todo tipo de industria, puesto que en la mayoría de los casos, los clientes representan un factor económico sumamente importante para las empresas, y además, es más rentable retener un cliente antiguo que captar uno nuevo. De esto nace la necesidad de un modelo estadístico capaz de predecir esta situación de forma robusta y confiable con el fin de retener clientes y evitar su eventual fuga. El presente proyecto propone el diseño y desarrollo de un modelo predictivo de fuga de un segmento específico de clientes punto a punto en el mercado de foodservice en la empresa Agrosuper, para el cual se desarrollan, validan y comparan 3 tipos de modelos predictivos diferentes: regresión logística, random forest y support vector machine. Para este fin, siguiendo con la metodología de multiple time slicing, se construye un dataset de características explicativas utilizando 6 ventanas de tiempo de 12 meses cada una, que se utiliza para el entrenamiento y validación de los modelos, y un dataset de validación out time para evaluar el desempeño y la estabilidad temporal de los modelos. Los datos son analizados y transformados mediante transformaciones estadísticas univariadas, técnicas de tratamiento de multicolinealidad y reducción de dimensionalidad. Se realiza una segmentación de clientes en base a un análisis estadístico de comportamiento transaccional, donde se obtienen los clientes más estables y recurrentes. Finalmente se entrenan, validan y comparan los modelos mediante matrices de confusión y métricas de desempeño tanto en conjunto de validación como validación out time, en donde el modelo con el mejor desempeño en validación out time, y que seguirá a la implementación futura, resultó ser la regresión logística, siguiendo con random forest y terminando con support vector machine, el cual tuvo un desempeño relativamente bueno en validación pero disminuyó notablemente en validación out time. Con los resultados se concluye acerca de la importancia de la validación out time, puesto que permite evidenciar el real desempeño de un modelo y su estabilidad temporal, permitiendo escoger el mejor modelo para la implementación en producción.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Eléctrico
Identifier
URI: https://repositorio.uchile.cl/handle/2250/193177
Collections
The following license files are associated with this item: