Clasificación de productos a través de árboles de categorías para e-commerce
Professor Advisor
dc.contributor.advisor
Barrios Núñez, Juan
Author
dc.contributor.author
García Gutiérrez, Matías Ignacio
Associate professor
dc.contributor.other
Silva Sánchez, Jorge
Associate professor
dc.contributor.other
Saavedra Rondo, José
Admission date
dc.date.accessioned
2020-07-15T01:53:16Z
Available date
dc.date.available
2020-07-15T01:53:16Z
Publication date
dc.date.issued
2020
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/175986
General note
dc.description
Memoria para optar al título de Ingeniero Civil Eléctrico
es_ES
Abstract
dc.description.abstract
El presente documento expone el trabajo de construcción y evaluación de clasificadores jerárquicos utilizando técnicas de \textit{Machine Learning} con el objetivo de resolver el problema de clasificación de subcategorías en un e-commerce. Para esto se utilizan dos tipos de clasificadores jerárquicos: Uno local que utiliza un clasificador por nodo de decisión en el árbol y otro global donde se utiliza un solo clasificador para la predicción de las subcategorías.
El problema a resolver, nace de la necesidad de automatizar la elección de subcategorías que el usuario debe ingresar cuando ofrece sus productos a través de un marketplace, ya que éste puede producir potenciales errores de mala clasificación, reduciendo la efectividad del marketplace para vender ese producto.
La forma de resolver el problema planteado, consta de estudiar las técnicas actuales de clasificación jerárquica, procesamiento de lenguaje natural y visión computacional, además de formas de evaluar el problema de clasificación jerárquica. Para posteriormente, construir y entrenar los clasificadores jerárquicos de tipo global y local y ser utilizados como una automatización al problema de elección de subcategorías. El clasificador jerárquico global corresponde a una red neuronal inspirada en las técnicas aplicadas en Yolo 9000 a la que bautizo como HiGNet (Hierarchical Global Network) y el clasificador local se construye utilizando un clasificador RandomForest por nodo de decisión del árbol de categorías.
Con los resultados obtenidos, se concluye que el clasificador jerárquico local con descriptores de texto obtiene los mejores resultados en todas las métricas utilizadas asociadas a la precisión del clasificador en las primeras cuatro subcategorías, pero con la desventaja de tener intenso uso de recursos computacionales, mientras que HiGNet es liviano en uso de recursos computacionales, pero presenta una importante baja de precisión en las subcategorías más específicas.