Abstract | dc.description.abstract | El presente informe contiene el análisis realizado para una empresa de retail financiero, y considera variables obtenidas por medio de minería de texto para incluirlas dentro de dicho modelo.
Dentro de la empresa estudiada, se tienen dos tipos de clientes. Uno de ellos suele realizar comentarios con la empresa, tanto positivos como negativos. Estos además suele gastar más en un periodo de tiempo (en promedio) que un cliente que no lo realiza. Por ejemplo, dentro de un determinado mes el cliente que realiza comentarios gasta aproximadamente entre dos y tres veces más que su contraparte que no realiza comentarios. Al mismo tiempo, los clientes que si realizan comentarios son tres veces menos propensos a la fuga que los que no los realizan. Ante esto surge la oportunidad de negocios de determinar si por medio de herramientas de minería de texto se puede extraer información útil de los comentarios para predecir la fuga de los clientes, y minimizarla con estas variables.
El objetivo de esta memoria es construir un modelo predictivo de fuga utilizando textos para poder mejorar la retención de clientes.
Para lograr cumplir con este objetivo, se realizaron 4 modelos de fuga. El primer modelo de fuga consistía en un modelo de fuga tradicional (accuracy:77,5% ,presicion:82% y AUC:85,1%), un modelo de fuga con variables de minería de texto solo para los clientes que tienen comentario (accuracy: 77,9% ,presicion:80,9% y AUC: 85,4%), un modelo de fuga con variable de minería de textos para toda la cartera sin imputar valores desconocidos (accuracy: 76,1% ,presicion:97,7% y AUC:83,7%) y un modelo de fuga con variable de minería de texto imputados para aquellos que no tenían comentario (accuracy: 75,7% ,presicion:82% y AUC:84,2%).
Con respecto a los resultados del modelo de fuga, se concluye que dentro de todos los modelos estudiados, el mejor modelo es uno que considera variables de minería de texto sobre una base de clientes en que todos emiten comentarios. Dado que este no se puede generalizar para todos los clientes de la empresa, decide utilizar el modelo de fuga tradicional sin variables de minería de texto. Otra conclusión importante con respecto a la memoria es que la imputación de las variables de minería de textos no causa un aumento en el rendimiento con respecto a un modelo que no lo hace. Esto se debe a que al comparar los modelos con y sin imputación de datos, el modelo que incluye la imputación de los datos de la variable de minería de texto tiene menor accuracy (0,4% menos de accuracy), presenta un AUC levemente mayor (0,5% más de AUC). A pesar de esto, las variables de minería de texto apoyan dentro de la gestión de los clientes que si realizan comentarios. | es_ES |