Abstract | dc.description.abstract | Este trabajo tiene como objetivo la creación de un panel de clientes de una institución bancaria, que permitiera el cálculo de indicadores de su comportamiento a través del tiempo con el fin de observar el efecto de acciones comerciales de dicha entidad.
El foco investigativo fue diseñar una metodología adecuada para lograr una muestra representativa y de calidad de los 8.297.628 clientes del segmento personas, que pudiera ser mantenida y que asegurara entregar la información requerida en el tiempo.
Para su construcción se revisó la bibliografía de datos de panel, lo que permitió realizar un consolidado de los tópicos estadísticos que sustentan la presente tesis, destacando las ventajas del uso de datos de panel, sus diseños y la teoría base de toda inventigación que utiliza muestras.
Para asegurar que el panel fuera una solución efectiva al problema de negocio, se decidió elegir las variables en las que el panel pudiera entregar mediciones con un cierto nivel de confianza. A través del estudio de la información disponible y entrevistas con ejecutivos, se determinó que las variables de interés del panel serían: transaccionalidad de canales, tenencia de productos, volumen del negocio y uso de productos cruzados.
Las grandes diferencias del valor de dichas variables y la alta variabilidad en el número de individuos en los distintos cruces de la población objetivo hicieron concluir que el panel correspondería a una muestra aleatoria estratificada – no equilibrada .
Para la selección de las variables de estratificación se realizó un estudio de las distribuciones poblacionales en las variables clasificadoras de los clientes, dejando como candidatas aquellas con información completa (al menos 97%) y que presentaban una concentración mayor al 50% en al menos un nivel. Las variables seleccionadas fueron: segmento, renta, región y GRS (grupo de relación similar, creados en base a la tenencia de productos de los clientes). Luego de demostrar dichas variables tenían un efecto no nulo en las variables de interés del panel, a través de las pruebas de contraste de Games-Howell se definieron los niveles de corte, obteniendo un total de 312 estratos.
El tamaño de muestra, 49.770, fue calculado en base al objetivo de cumplir con la estimación de proporciones en varios niveles. La extracción de clientes no resultó constante para cada estrato. El desbalance de la muestra obtenida respecto a la población hizo necesaria la utilización de ponderadores para calibrar el panel, devolviéndole así la representatividad de la población total de clientes.
Los principales resultados de este trabajo son la estructuración de la información, el levantamiento del panel y la automatización de procesos: para extraer la muestra, calcular los ponderadores y obtener las métricas de comportamiento de clientes.
Para validar, se contrastó la mayor cantidad de información poblacional disponible con las estimaciones del panel, obteniendo errores inferiores al 3%. Dicho proceso permitió concluir que las decisiones de diseño tomadas favorecían el control del panel y aportaban flexibilidad en el manejo de información de los clientes de la institución, al permitir la estimación en 176 dimensiones con bajo error.
Finalmente, se concluyó que este trabajo posibilita realizar futuros estudios ad-hoc mediante la selección de clientes del panel para la aplicación de encuestas, así cómo análisis econométricos para estudios de comportamiento complejo. Sin embargo, como trabajo prioritario, se recomienda una exhaustiva revisión y perfeccionamiento de la calidad del data warehouse de la entidad. | |