El presente trabajo tiene como objetivo desarrollar un buscador de productos de comercio
electrónico, orientado a las tiendas en línea chilenas, y que provea facilidades para
identificar productos iguales y similares.
Los buscadores de comercio electrónico concentran productos ofrecidos por diferentes
sitios otorgando al usuario una interfaz de consulta única, y mostrando como resultado
productos de diferentes tiendas en un listado unificado. Todo esto con el objetivo básico de
comparar precios y ayudar al usuario en la elección de su compra.
BuscaPé y Confronte son los únicos buscadores de productos de comercio electrónico
orientados a tiendas en Chile. Su principal deficiencia es que no tienen un modelo genérico
para identificar automáticamente los productos iguales (igual marca y modelo), por lo
que identifican los productos iguales sólo para algunas categorías. Por otro lado, en
las categorías que se identifican los productos iguales es difícil comparar productos de
similares características, ya que el resultado de una búsqueda es una lista de productos
sin orden y sin más información que el título del producto.
En estos sitios la única forma de saber si dos productos tienen características similares
es ver los detalles de los productos, o seleccionar la opción “Comparar” que presenta una
matriz de comparación con los valores de algunas características para cada producto. El
problema de la matriz es que el usuario no sabe de antemano las características de los
productos, y por lo tanto debe usar prueba y error para formar una matriz de comparación
que realmente sirva para ayudar en una decisión de compra.
Como parte del trabajo realizado en la presente tesis se desarrolló un buscador de
productos de comercio electrónico denominado YOSH. YOSH es un meta buscador de
comercio electrónico, cuya información se estructura en una ontología, y que posee la
particularidad de detectar y recomendar productos similares basándose en medidas de
distancia entre productos.
La construcción de este buscador contempla el desarrollo de cinco módulos que forman
el sistema de recuperación de información completo: Crawler, Extractor de información,
Clasificador, Motor de recomendación e Interfaz de consulta. Cada uno de los módulos
presenta problemáticas y áreas de estudio particulares, y los aportes de este trabajo están
relacionados directamente cada uno de estos módulos.
En consecuencia los aportes de esta tesis son cinco: (a) Un framework para
implementación de Crawlers de comercio electrónico, (b) Una Ontología básica para
comercio electrónico, (c) Un clasificador SVM para asociar productos a categorías (d) Una
estrategia para detección de productos iguales y similares usando medidas de distancia
entre productos. (e) Una aplicación Web que provee una interfaz para búsqueda de
productos por keyword y navegación por categorías.