Professor Advisor | dc.contributor.advisor | Poblete Labra, Bárbara | |
Author | dc.contributor.author | Vargas Vargas, Maximiliano Enrique | |
Associate professor | dc.contributor.other | Bravo Márquez, Felipe | |
Associate professor | dc.contributor.other | Barrios Núñez, Juan Manuel | |
Admission date | dc.date.accessioned | 2022-07-26T20:47:00Z | |
Available date | dc.date.available | 2022-07-26T20:47:00Z | |
Publication date | dc.date.issued | 2022 | |
Identifier | dc.identifier.uri | https://repositorio.uchile.cl/handle/2250/186982 | |
Abstract | dc.description.abstract | La mayoría de los chilenos se informa a través de redes sociales y portales digitales de noticias. El periodismo chileno se encuentra ante múltiples escenarios: presencia de discurso de odio, fake news, desconfianza en medios tradicionales, un auge por información en redes sociales y medios independientes, la concentración de los medios tradicionales y también, la presencia de burbujas informativas. A modo de mejorar la calidad de la información, el presente trabajo busca abordar los problemas de sobrecarga de información, el quiebre de las burbujas informativas y también, la generación de métricas respecto de los sesgos periodísticos.
Para ello, se implementa un prototipo de sistema (Proof of Concept en inglés) escalable y flexible que recolecte artículos desde medios tradicionales e independientes, los agrupe por similitud formando eventos y los muestre en forma clara y ordenada. También, se utilizan tecnologías del Procesamiento del Lenguaje Natural (PLN) tanto para la medición de subjetividad y polaridad en texto, como la generación de resúmenes. Para el agrupamiento de noticias, se emplean dos metodologías. La primera usa modelos PLN transformers para obtener representaciones semánticas del texto, que luego serán agrupadas por algoritmos de clustering de una manera no supervisada. La segunda se basa en una heurística de palabras claves para agrupar titulares similares.
La plataforma desarrollada cuenta con dos secciones principales: agrupaciones y buscador. La primera muestra los resultados de las agrupaciones para una ventana de tiempo determinada. La segunda busca ser de utilidad pública para buscar artículos junto a las métricas de subjetividad y polaridad.
La calidad de las agrupaciones se evalúa en forma cualitativa, debido a la falta de una evaluación supervisada. Ambas metodologías muestran resultados prometedores, siendo la heurística la más eficiente en términos de rendimiento. Los modelos PLN utilizados han sido probados en diversos datasets y por esto, se tiene el supuesto de que deben funcionar bien en el sistema. Por último, para evaluar la utilidad del sistema completo, se analizan algunos casos de uso, y además, se efectúan veinticuatro entrevistas para recolectar comentarios y apreciaciones.
Finalmente, se demuestra la factibilidad técnica de este concepto, pero evidenciando la necesidad de recursos para el desarrollo a gran escala. Por otro lado, todos los entrevistados entregan comentarios muy positivos de la plataforma, calificándola como novedosa, que usarían con frecuencia y plantean muchos contextos donde puede ser usada: en el ámbito público, académico y empresarial. | es_ES |
Patrocinador | dc.description.sponsorship | FONDECYT 1191604 | es_ES |
Lenguage | dc.language.iso | es | es_ES |
Publisher | dc.publisher | Universidad de Chile | es_ES |
Type of license | dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
Link to License | dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
Keywords | dc.subject | Procesamiento de lenguaje natural (Ciencia de la computación) | |
Keywords | dc.subject | Noticias | |
Keywords | dc.subject | Heurística de palabras claves | |
Keywords | dc.subject | Análisis de sentimientos | |
Keywords | dc.subject | Aplicación web | |
Título | dc.title | Sistema de agrupación de noticias para el contraste de medios de comunicación chilenos tradicionales e independientes | es_ES |
Document type | dc.type | Tesis | es_ES |
dc.description.version | dc.description.version | Versión original del autor | es_ES |
dcterms.accessRights | dcterms.accessRights | Acceso abierto | es_ES |
Cataloguer | uchile.catalogador | gmm | es_ES |
Department | uchile.departamento | Departamento de Ciencias de la Computación | es_ES |
Faculty | uchile.facultad | Facultad de Ciencias Físicas y Matemáticas | es_ES |
uchile.carrera | uchile.carrera | Ingeniería Civil en Computación | es_ES |
uchile.gradoacademico | uchile.gradoacademico | Licenciado | es_ES |
uchile.notadetesis | uchile.notadetesis | Memoria para optar al título de Ingeniero Civil en Computación | es_ES |