Show simple item record

Professor Advisordc.contributor.advisorAbeliuk Kimelman, Andrés
Professor Advisordc.contributor.advisorBravo Márquez, Felipe
Authordc.contributor.authorMatamala Asencio, Bastián Nicolás
Associate professordc.contributor.otherGutiérrez Gallardo, Claudio
Associate professordc.contributor.otherSalinas Fernández, Sergio
Admission datedc.date.accessioned2025-05-13T21:42:39Z
Available datedc.date.available2025-05-13T21:42:39Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/204861
Abstractdc.description.abstractDada la relevancia que ha tomado el problema de la desinformación en los últimos años, este trabajo de memoria trata de abordarlo con un enfoque de Natural Language Processing explotando la relación entre el titular y cuerpo de una noticia, centrándose en tres dominios: clickbait, headline stance y fake news. Adicionalmente se aborda el problema de incongruencia, adaptando el corpus de stance. Usando la arquitectura BERT se logró obtener resultados competentes comparados conlos baseline elegidos, lo que valida el enfoque de titular-cuerpo aplicado para solucionar losproblemas de forma independiente. Pese a ello, existen observaciones respecto a la generalización en el problema de clickbait y la utilidad de usar el cuerpo como parte del proceso de entrenamiento para este dominio. Además fue imposible resolver el problema de incongruencia, pero se atribuye a la calidad de los datos por sobre la arquitectura o la estrategia usada. Con las arquitecturas entrenadas en cada dominio por separado se realizaron experimentos de predicción cruzada entre dominios de desinformación (cross domain). Esto implica que entrenar una arquitectura en un dominio de desinformación no garantiza que pueda generalizar hacia otro dominio de desinformación. Bajo ciertos escenarios, una estrategia de transfer learning entre dominios de desinformación aportó mejoras a los resultados, en particular para el problema de clickbait que evidenció un menor sesgo hacia la clase dominante y mejoró su efectividad en las métricas de la clase relevante. Ante la falta de datos en su configuración original, el problema de incongruencia se benefició de arquitecturas previamente entrenadas en otros dominios, aunque no lo suficiente como para mejorar los baselines. En general, los problemas de stance y congruencia se beneficiarían de mejores cuerpos de datos para entrenar. Estos dos dominios, más el de noticias falsas, también se beneficiarían de datos de prueba más robustos, que apliquen una metodología más robusta para la construcción de los datasets basada en etiquetación manual.es_ES
Patrocinadordc.description.sponsorshipEste trabajo ha sido parcialmente financiado por ANID FONDECYT grant 1200290 y National Center for Artificial Intelligence CENIA FB210017, Basal ANIDes_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleAnalizando la relación entre dominios de desinformación en base al título y el cuerpo de una noticiaes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil en Computaciónes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States