Desarrollo de un clúster de comportamiento según posición para las Product Listing Pages de un e-Commerce
Tesis
Access note
Acceso abierto
Publication date
2021Metadata
Show full item record
Cómo citar
Segovia Riquelme, Carolina
Cómo citar
Desarrollo de un clúster de comportamiento según posición para las Product Listing Pages de un e-Commerce
Author
Professor Advisor
Abstract
Según el último informe del World Economic Forum, se pronostica un aumento de la penetración del e-commerce en un 40 % para el año 2026 [1]. Además, la pandemia vivida en Chile y el mundo durante 2020 ha provocado estragos en empresas del retail, generando una disminución de sus ingresos en hasta un 25% [2]. Dado esto, las tiendas por departamento están constantemente invirtiendo recursos para potenciar sus canales online, evaluando que metodologías resultan más beneficiosas para aumentar los ingresos de la compañía.
El trabajo es realizado en la empresa Falabella Retail S.A, y su objetivo es desarrollar una clusterización de las listas de productos (PLP) originadas por las categorías presentes en Falabella.com, según el comportamiento de los elementos que la componen, para evaluar y mejorar el desempeño del modelo utilizado en la optimización de contribución. Dicho modelo, actualmente genera un aumento en la contribución de un 3,61 %, lo que se traduce en ganancias para Falabella.com de aproximadamente $50.000.000.
La metodología utilizada consistirá en realizar un clúster jerárquico con medida de dis- tancia basada en Correlación de Pearson, para agrupar PLP con distribuciones similares en sus KPI, a través de las posiciones de la lista. Luego, se procederá a entrenar un modelo de optimización que recibe como input los grupos de comportamiento similar y entrega como output un orden de productos que maximiza contribución, el cual será comparado de manera offline con el modelo actual, a través de la métrica NDCG (Normalized Discounted Cumula- tive Gain).
Los resultados de la clusterización dieron origen a 15 clúster para las 4000PLP activas en la página, revelando distribuciones de comportamiento de tipo Pareto, Uniforme y una combinación de las anteriores. Los conglomerados con más venta se identificaron con elementos de la categoría Tecnología, acumulando un 35% del total de venta y presentando una distribución Pareto. Los clúster con mayor cantidad de unidades vendidas, se identificaron con elementos de las categorías Moda Hombre, Moda Mujer y Moda Niño, acumulando un 40 % del total de unidades vendidas y presentando una distribución más uniforme.
Finalmente, tras la modificación y el entrenamiento del modelo de optimización, los resul- tados obtenidos fueron disimiles en cada clúster. En específico, el rendimiento promedio para el NDCG de contribución disminuye entre ambas metodologías en un 20,6 %, y el rendimien- to promedio para el NDCG de conversión lo hace en un 11,6 %. Además, se concluyó que el nivel de ruido en la distribución no es un factor determinante en el resultado. Sin perjuicio de lo anterior, se estudiaron las posibles causas del bajo rendimiento obtenido, generando 3 hipótesis, con los lineamientos necesarios para un desarrollo futuro.
General note
Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/181051
Collections