Diseño e integración de un módulo para detectar y categorizar opiniones de reclamo en un sistema de análisis Web aplicado al rubro de las telecomunicaciones
Tesis
Publication date
2017Metadata
Show full item record
Cómo citar
Velásquez Silva, Juan
Cómo citar
Diseño e integración de un módulo para detectar y categorizar opiniones de reclamo en un sistema de análisis Web aplicado al rubro de las telecomunicaciones
Author
Professor Advisor
Abstract
El objetivo general de esta memoria de titulo es diseñar e integrar un módulo para detectar y categorizar opiniones de reclamos en un sistema de análisis web utilizando herramientas de Ma- chine Learning. Este trabajo se desarrolla dentro del marco del proyecto OpinionZoom, que es un proyecto de investigación y desarrollo concursado por InnovaChile de CORFO y dirigido por el Web Intelligence Centre (WIC) de la Universidad de Chile. Este proyecto busca aumentar el co- nocimiento que tienen las organizaciones sobre individuos pertenecientes a la industria que sirven, utilizando los datos públicos de los usuarios chilenos de Twitter.
En esta etapa de OpinionZoom surge la oportunidad de utilizar el contenido que los usuarios envían a las cuentas de Twitter de las empresas en referencia a los reclamos, cuyo interés nace de las entrevistas y requerimientos de los comienzos de este proyecto, en conjunto con el poco provecho que extraen las empresas de esta red social.
Esta memoria de título pretende comprobar la hipótesis de investigación de utilizar algoritmos de Data Mining y Machine Learning que permitan identificar opiniones de reclamos en Twitter y clasificarlas en categorías predefinidas. Lo que se divide en dos etapas, la primera consiste en identificar opiniones de reclamos en Twitter, algo que no ha sido investigado hasta el momento, y como segunda etapa categorizar el contenido de estos mensajes en función de los productos y servicios de las empresas. Para la validación de esta hipótesis se decidió por utilizar el segmento de mayor relevancia en términos de reclamos en la red social Twitter: Telecomunicaciones.
El potencial de lo desarrollado en este trabajo es entregar información útil a la empresas sobre los reclamos, a nivel agregado, que sus clientes y usuarios expresan en la red social de Twitter, de modo de que puedan tomar mejores decisiones.
Se utilizó un set de datos que abarcó toda la historia de cuatro cuentas de Twitter, cuya elección se basó en la relevancia en el ámbito de los reclamos en la red social. Los datos se modelaron con el enfoque Bag-Of-Words y se implementaron 4 algoritmos de Machine Learning para clasificar los tweets en una primera etapa dentro de 4 clases, incluida reclamo, y en una segunda etapa en 9 categorías predefinidas. Para la primera etapa el algoritmo Support Vector Machines entregó los mejores resultados con un F-Measure de 0.823 para la clase Reclamo. Y para la segunda etapa los mejores resultados se lograron en Support Vector Machines y Decision Trees con un accuracy de 81.3%. Lo que permite validar la hipótesis de investigación. Finalmente, se diseñó e implemento el módulo para detectar y categorizar reclamos en la plataforma web de OpinionZoom.
General note
Ingeniero Civil Industrial
Patrocinador
Este trabajo ha sido parcialmente financiado por el proyecto CORFO 13IDL2-23170
Identifier
URI: https://repositorio.uchile.cl/handle/2250/147220
Collections
The following license files are associated with this item: