Sistema de agrupación de noticias para el contraste de medios de comunicación chilenos tradicionales e independientes
Tesis
Access note
Acceso abierto
Publication date
2022Metadata
Show full item record
Cómo citar
Poblete Labra, Bárbara
Cómo citar
Sistema de agrupación de noticias para el contraste de medios de comunicación chilenos tradicionales e independientes
Professor Advisor
Abstract
La mayoría de los chilenos se informa a través de redes sociales y portales digitales de noticias. El periodismo chileno se encuentra ante múltiples escenarios: presencia de discurso de odio, fake news, desconfianza en medios tradicionales, un auge por información en redes sociales y medios independientes, la concentración de los medios tradicionales y también, la presencia de burbujas informativas. A modo de mejorar la calidad de la información, el presente trabajo busca abordar los problemas de sobrecarga de información, el quiebre de las burbujas informativas y también, la generación de métricas respecto de los sesgos periodísticos.
Para ello, se implementa un prototipo de sistema (Proof of Concept en inglés) escalable y flexible que recolecte artículos desde medios tradicionales e independientes, los agrupe por similitud formando eventos y los muestre en forma clara y ordenada. También, se utilizan tecnologías del Procesamiento del Lenguaje Natural (PLN) tanto para la medición de subjetividad y polaridad en texto, como la generación de resúmenes. Para el agrupamiento de noticias, se emplean dos metodologías. La primera usa modelos PLN transformers para obtener representaciones semánticas del texto, que luego serán agrupadas por algoritmos de clustering de una manera no supervisada. La segunda se basa en una heurística de palabras claves para agrupar titulares similares.
La plataforma desarrollada cuenta con dos secciones principales: agrupaciones y buscador. La primera muestra los resultados de las agrupaciones para una ventana de tiempo determinada. La segunda busca ser de utilidad pública para buscar artículos junto a las métricas de subjetividad y polaridad.
La calidad de las agrupaciones se evalúa en forma cualitativa, debido a la falta de una evaluación supervisada. Ambas metodologías muestran resultados prometedores, siendo la heurística la más eficiente en términos de rendimiento. Los modelos PLN utilizados han sido probados en diversos datasets y por esto, se tiene el supuesto de que deben funcionar bien en el sistema. Por último, para evaluar la utilidad del sistema completo, se analizan algunos casos de uso, y además, se efectúan veinticuatro entrevistas para recolectar comentarios y apreciaciones.
Finalmente, se demuestra la factibilidad técnica de este concepto, pero evidenciando la necesidad de recursos para el desarrollo a gran escala. Por otro lado, todos los entrevistados entregan comentarios muy positivos de la plataforma, calificándola como novedosa, que usarían con frecuencia y plantean muchos contextos donde puede ser usada: en el ámbito público, académico y empresarial.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Patrocinador
FONDECYT 1191604
Identifier
URI: https://repositorio.uchile.cl/handle/2250/186982
Collections
The following license files are associated with this item: