Clasificación de productos a través de árboles de categorías para e-commerce
Tesis
Publication date
2020Metadata
Show full item record
Cómo citar
Barrios Núñez, Juan
Cómo citar
Clasificación de productos a través de árboles de categorías para e-commerce
Author
Professor Advisor
Abstract
El presente documento expone el trabajo de construcción y evaluación de clasificadores jerárquicos utilizando técnicas de \textit{Machine Learning} con el objetivo de resolver el problema de clasificación de subcategorías en un e-commerce. Para esto se utilizan dos tipos de clasificadores jerárquicos: Uno local que utiliza un clasificador por nodo de decisión en el árbol y otro global donde se utiliza un solo clasificador para la predicción de las subcategorías.
El problema a resolver, nace de la necesidad de automatizar la elección de subcategorías que el usuario debe ingresar cuando ofrece sus productos a través de un marketplace, ya que éste puede producir potenciales errores de mala clasificación, reduciendo la efectividad del marketplace para vender ese producto.
La forma de resolver el problema planteado, consta de estudiar las técnicas actuales de clasificación jerárquica, procesamiento de lenguaje natural y visión computacional, además de formas de evaluar el problema de clasificación jerárquica. Para posteriormente, construir y entrenar los clasificadores jerárquicos de tipo global y local y ser utilizados como una automatización al problema de elección de subcategorías. El clasificador jerárquico global corresponde a una red neuronal inspirada en las técnicas aplicadas en Yolo 9000 a la que bautizo como HiGNet (Hierarchical Global Network) y el clasificador local se construye utilizando un clasificador RandomForest por nodo de decisión del árbol de categorías.
Con los resultados obtenidos, se concluye que el clasificador jerárquico local con descriptores de texto obtiene los mejores resultados en todas las métricas utilizadas asociadas a la precisión del clasificador en las primeras cuatro subcategorías, pero con la desventaja de tener intenso uso de recursos computacionales, mientras que HiGNet es liviano en uso de recursos computacionales, pero presenta una importante baja de precisión en las subcategorías más específicas.
General note
Memoria para optar al título de Ingeniero Civil Eléctrico
Identifier
URI: https://repositorio.uchile.cl/handle/2250/175986
Collections
The following license files are associated with this item: