Metodología para el diseño y construcción de un lexicón de opinión, basado en comentarios de Twitter aplicado al proyecto "OpinionZoom"
Professor Advisor
dc.contributor.advisor
Velásquez Silva, Juan Domingo
Author
dc.contributor.author
Hernández Muñoz, Natalia Paola
Staff editor
dc.contributor.editor
Facultad de Ciencias Físicas y Matemáticas
Staff editor
dc.contributor.editor
Departamento de Ingeniería Industrial
Associate professor
dc.contributor.other
Vildoso Castillo, Felipe
Associate professor
dc.contributor.other
Moya Muñoz, Patricio
Admission date
dc.date.accessioned
2016-06-23T18:58:59Z
Available date
dc.date.available
2016-06-23T18:58:59Z
Publication date
dc.date.issued
2016
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/139092
General note
dc.description
Ingeniera Civil Industrial
Abstract
dc.description.abstract
El presente trabajo tiene como objetivo diseñar y construir una metodología para la creación de un lexicón de opinión en el que se identifique su polaridad, considerando las características del español de Chile y basado en comentarios de Twitter, aplicado al proyecto OpinionZoom . Es desarrollado dentro del proyecto OpinionZoom, plataforma de análisis de sentimientos e ironía a partir de la información textual en redes sociales para la caracterización de la demanda de productos y servicios , donde se presenta la problemática de no tener un lexicón de opinión apropiado para el análisis de sentimientos que se realiza.
La hipótesis de investigación de este trabajo postula que la construcción de un lexicón de opinión que considere las particularidades del español de Chile en Twitter mejora el desempeño de la herramienta OpinionZoom . Para comprobar esta hipótesis se ha utilizado una metodología basada en un corpus lingüístico para la generación de un lexicón de opinión.
Se construyó un corpus de tweets clasificados en positivos y negativos según los emoticones que presentan, luego se utilizó este corpus en la construcción del lexicón, utilizando la frecuencia de las palabras presentes en comentarios positivos y negativos y calculando su polaridad en base a la información mutua que se tiene, empleando el cálculo de PMI.
Para la validación del lexicón de opinión se midió el desempeño del sistema de análisis de opiniones con el lexicón de opinión actual, que presenta licencia sólo de uso académico, y con el lexicón de opinión construido en este trabajo. Comparando ambos desempeños, se observaron mejoras en cuanto a exactitud, precisión y exhaustividad para el sistema con el lexicón construido, por lo que la hipótesis planteada en este trabajo se comprueba.
En conclusión, la utilización de un lexicón de opinión que considere las características del español de Chile mejora el desempeño del sistema de análisis de opiniones de OpinionZoom , la utilización de emoticones para identificar la polaridad representa un indicador representativo en comentarios de Twitter, por lo que se puede ampliar la investigación utilizando emojis para la identificación de polaridad.