Desarrollo e implementación de un sistema para identificar tópicos de interés de usuarios chilenos en Twitter
Professor Advisor
dc.contributor.advisor
Velásquez Silva, Juan
Author
dc.contributor.author
Camino Alcalde, Sebastián Leonardo
Associate professor
dc.contributor.other
Vildoso Castillo, Felipe
Associate professor
dc.contributor.other
Cabezas Bullemore, Alberto
Associate professor
dc.contributor.other
Ruiz Moreno, Rocío
Admission date
dc.date.accessioned
2017-05-24T19:51:23Z
Available date
dc.date.available
2017-05-24T19:51:23Z
Publication date
dc.date.issued
2016
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/144085
General note
dc.description
Ingeniero Civil Industrial
es_ES
Abstract
dc.description.abstract
El objetivo general de esta memoria de título es diseñar e implementar un sistema de User Interest Modeling, que sea capaz de identificar tópicos de interés de usuarios chilenos en Twitter. Este trabajo se desarrolla dentro del marco del proyecto OpinionZoom, que es un proyecto de I+D aplicada concursado por InnovaChile de CORFO y dirigido por el Web Intelligence Centre de la Universidad de Chile. El proyecto busca generar un sistema avanzado de análisis de datos extraídos desde redes sociales para obtener información relevante para las instituciones y empresas en relación a sus productos y servicios.
La información obtenida a partir de los usuarios en las redes sociales puede tener muchos usos. Uno de éstos es caracterizar a los usuarios e identificar sus tópicos de interés. Contar con esta información puede ayudar a las organizaciones a conocer mejor a sus clientes, lo que les permitiría tomar mejores decisiones. Los métodos más utilizados para identificar tópicos de interés en Twitter usan el contenido generado por el usuario a caracterizar, sin embargo este enfoque conlleva un problema: la gran mayoría de los usuarios no tweetea o lo hace muy poco. Esto significa que los métodos que utilizan este enfoque no podrán identificar los tópicos de muchos usuarios y varios tendrán resultados deficientes, por lo que se necesita un enfoque distinto.
La hipótesis de investigación de este trabajo dice que es posible obtener tópicos de interés de usuarios chilenos de Twitter a partir de sus conexiones en la red social y sin utilizar el contenido generado por ellos, es decir sin utilizar sus tweets.
El sistema desarrollado se basa en la metodología propuesta por Bhattacharya et al., pero enfocado en el Español para caracterizar de mejor forma a los usuarios chilenos. Este sistema utiliza la información de las listas de Twitter, para inferir los tópicos de influencia de usuarios populares de la red social, para luego inferir transitivamente los tópicos de interés de los usuarios que los siguen. Está compuesto de 4 módulos principales: el primero se encarga de extraer los datos de Twitter; el segundo procesa el texto de las listas e identifica los tópicos que las caracterizan; el tercero identifica los tópicos de influencia de los usuarios populares de Twitter; finalmente, el último módulo identifica los tópicos de interés agregando la información de los tópicos de influencia.
Se utilizó el sistema para identificar tópicos de interés de algunos usuarios de Twitter y se validó la hipótesis de investigación, ya que el 97% de los usuarios evaluados se consideró representado por los tópicos identificados. Con esto, se tiene un sistema capaz de identificar tópicos de interés en español de la gran mayoría de usuarios de Twitter, con alta precisión y mejores resultados que la situación actual.