Abstract | dc.description.abstract | El objetivo de este trabajo es diseñar e implementar una aplicación de web opinion mining para encontrar preferencias sobre productos turísticos en la X Región de Los Lagos, Chile.
Esta aplicación se desarrolló bajo el proyecto FONDEF D10I1198, conocido como WHALE (Web Hypermedia Analysis Long-Term Environment), que aborda la situación de la industria del turismo en Los Lagos, donde los operadores turísticos caracterizan la demanda y definen la oferta usando estudios de alcance limitado. Estos estudios no son capaces de cubrir un número representativo de participantes porque se aplican a grupos específicos de personas, dejando la demanda potencial proveniente de fuera de la región sin estudiar. Dada esta situación, se torna importante considerar métodos alternativos de estudio.
Con el explosivo crecimiento de la Web 2.0, la cantidad de información disponible on-line es hoy inmensa. Este trabajo ofrece un enfoque que considera una nueva alternativa para descubrir preferencias de clientes sobre productos turísticos, particularmente hoteles y restaurants, usando opiniones disponibles en la Web en la forma de reviews. Esta tarea presenta desafíos importantes, principalmente por el hecho de que los datos son variables en el tiempo y están frecuentemente dispuestos en una forma semi-estructurada.
En este contexto, web opinion mining o WOM ofrece un conjunto de técnicas para analizar datos de opiniones y definir una estructura a partir de ellos. En particular, aspect-based opinion mining propone dividir las opiniones en aspectos, tópicos importantes o representativos que, en el caso de los reviews de productos, se conciben como componenentes o atributos de cada producto con su respectiva orientación sentimental. Este trabajo propone que los reviews en la Web contienen información valiosa sobre productos turísticos y que, mediante la aplicación de algoritmos de aspect-based opinion mining a estos reviews, es posible descubrir las preferencias de los consumidores sobre dichos productos. Esta información, una vez extraída, puede ser usada por diferentes actores en una industria, particularmente, la del turismo en Los Lagos.
El diseño de la aplicación propuesta incluyó modelar las opiniones, generar algoritmos específicos para extraer estas opiniones desde los reviews, crear de corpus linguistico para evaluar el desempeño de los algoritmos y proponer una arquitectura de software para la aplicación en sí. La implementación consistió en desarrollar el software propuesto usando Python.
Los resultados mostraron que los reviews de productos turísticos disponibles en en sitios web contienen información valiosa sobre las preferencias de los consumidores y que estas pueden encontrarse usando un enfoque de aspect-based opinion mining. Sin embargo, en promedio, los algoritmos sólo fueron capaces de extraer un 35% de los aspectos, aunque mostraron ser muy efectivos en determinar la orientación sentimental, obteniendo una precision y recall promedio de un 90%. | es_CL |