Show simple item record

Professor Advisordc.contributor.advisorHogan, Aidan
Authordc.contributor.authorDíaz Mizunuma, Javiera Paola
Associate professordc.contributor.otherAbeliuk Kimelman, Andrés
Associate professordc.contributor.otherSarmiento Albornoz, Hernán
Admission datedc.date.accessioned2024-08-13T17:12:32Z
Available datedc.date.available2024-08-13T17:12:32Z
Publication datedc.date.issued2024
Identifierdc.identifier.other10.58011/7cdy-k829
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/200209
Abstractdc.description.abstractTelarKG es una base de datos orientada a grafos que contiene información referente al proceso constituyente en Chile del año 2021. Entre los datos que almacena se encuentran publicaciones de Twitter (tuits) y entidades de convencionales constituyentes de ese periodo, entre otros. Al explorar la magnitud de 20 millones de tuits almacenados, se revela un desafío: únicamente un pequeño porcentaje establece conexiones dentro de la base de datos. Los tuits enlazados son aquellos publicados por miembros de la convención. En cuanto a los tuits restantes, aunque compartan una temática común, no poseen enlaces identificables. Esta falta de vinculación plantea un desafío significativo para el análisis de los datos almacenados, limitando la capacidad de investigación. La propuesta de solución consiste en enlazar los tuits con entidades reconocidas procedentes de otra fuente de datos, como Wikidata. Esta última dispone de datos y metadatos relevantes para el caso de estudio, incluyendo información sobre los miembros de la convención constitucional, partidos políticos chilenos y lugares geográficos. Con el propósito de enriquecer TelarKG mediante la generación de enlaces en los tuits, se aplica sobre estos entity linking, una tarea del Procesamiento de Lenguaje Natural, que genera enlaces entre texto y alguna fuente de datos, como lo es Wikidata. Esta tarea enfrenta dos desafíos fundamentales: la considerable magnitud de datos a procesar y la escasa contextualización proporcionada en los tuits, generando casos desafiantes para el proceso de entity linking. Se investiga la viabilidad de etiquetar la totalidad de los datos y se realiza una evaluación de la calidad de las etiquetas identificadas. Estos resultados se incorporan a TelarKG en forma de 71.590 nuevas entidades y 29.311.087 enlaces con tuits. Esta adición posibilita la ejecución de consultas específicas sobre los tuits almacenados en TelarKG, ofreciendo la capacidad de realizar consultas más complejas en comparación con el buscador de Twitter o con la base de datos de TelarKG por sí solos.es_ES
Patrocinadordc.description.sponsorshipDepartamento de Ciencias de la Computación, FCFM, Centro de Costos 1618es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleEnlazando Twitter con Wikidataes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniera Civil en Computaciónes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States