Métodos de selección de atributos basados en utilidades para la predicción de fuga de clientes en telecomunicaciones

Hoy en día, respondiendo a la gran capacidad de almacenaje de datos, y procesamiento de éstos, existe un interés creciente en descubrir patrones en la información recabada y delegar problemas de negocio a procesos de aprendizaje automatizado, ayudando a tomar decisiones empresariales fundamentadas desde un sustento teórico, y con precisión que un conjunto de individuos no sería de capaz alcanzar dado el volumen de datos y la dificultad de descubrir de manera eficiente los patrones ocultos en las bases de datos. Una rama importante de estos problemas de negocios, es la clasificación binaria y una problemática que ha despertado gran interés es la predicción de fuga de clientes, debido a la facilidad con que estos últimos pueden cambiarse de empresa de servicios, en particular en el sector de Telecomunicaciones. En este caso los modelos son orientados a identificar el conjunto de clientes con mayor tendencia a dejar su empresa de servicios actual, basándose en sus características individuales descritas en forma de atributos numéricos o cualitativos, como por ejemplo variables socio-demográficas, comportamiento de pago, etc.. Uno de los grandes desafíos en esta línea, es la selección de atributos para el modelo de clasificación. La mayoría de las técnicas de selección de atributos, sin embargo, son basadas en criterios de validación estadística, perdiendo en muchos casos el objetivo del negocio en si mismo, lo que no necesariamente lleva a modelos que optimicen las metas definidas por la empresa. En este trabajo de Tesis se propone un enfoque basado en utilidades para la construcción del modelo de clasificación y selección de atributos, usando la herramienta de Support Vector Machines, en donde las métricas basadas en utilidades simulan la realización de una campa\~na de retención de clientes enfocada al grupo objetivo que el clasificador determine, considerando beneficios y costos Maximum Profit Criterion (MPC) y Expected Maximum Profit Criterion (EMPC)) o bien sólo costos, como es el caso de H-measure. Este enfoque consiste en un método de selección de atributos empotrado en la construcción del modelo clasificador, que apunta a la eliminación secuencial de atributos removiendo los que tienen menor relevancia de acuerdo a las métricas basadas en utilidades recién descritas, reduciendo así la dimensionalidad del problema original. Los resultados experimentales indican que estos métodos de selección de atributos y evaluación de modelos son más estables (al reducir atributos) y obtienen mejores resultados tanto en términos de métricas usuales de evaluación de modelos predictivos (AUC), como en métricas de desempeño basadas en utilidades orientadas al negocio de Telecomunicaciones (en el contexto de fuga de clientes). Lo que deja planteada la posibilidad de extender esta metodología a otros rubros, definiendo de forma conveniente las funciones de utilidades propias de cada negocio en particular.

General note

Magíster en Gestión de Operaciones

Ingeniero Civil Matemático

Identifier

URI: https://repositorio.uchile.cl/handle/2250/130311

Collections