Show simple item record

Professor Advisordc.contributor.advisorHogan, Aidan
Authordc.contributor.authorCaballero Guillén, Marco Antonio
Associate professordc.contributor.otherBustos Cárdenas, Benjamin Eugenio
Associate professordc.contributor.otherGutiérrez Gallardo, Claudio Domingo
Associate professordc.contributor.otherArroyuelo Billiardi, Diego Gastón
Admission datedc.date.accessioned2022-03-28T15:34:34Z
Available datedc.date.available2022-03-28T15:34:34Z
Publication datedc.date.issued2021
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/184543
Abstractdc.description.abstractWikidata es una base de datos de grafos, la cual está formada por entidades (nodos) y relaciones (aristas) que unen las entidades. En el contexto de este tipo de bases de datos, hay varias aplicaciones que dependen de una noción de similitud entre entidades que describen el grafo, por ejemplo, para proveer recomendaciones al usuario. Una medida global de similitud intenta establecer un valor numérico a cada par posible de entidades; dicho valor determina la similitud entre dos entidades. Existen medidas de similitud para grafos con características diferentes a Wikidata; en particular, las medidas existentes no consideran toda la información disponible en Wikidata, como por ejemplo las etiquetas de las aristas que denotan diferentes tipos de relaciones. En este trabajo se adapta y aplica una medida de similitud bastante utilizada en la actualidad llamada SimRank; se analiza la calidad de sus resultados al ser aplicada en Wikidata, para luego identificar las debilidades y fortalezas de esta medida. Además de hacer el análisis anterior, se proponen 3 medidas de similitud para ser aplicadas a Wikidata; dichas medidas logran aproximarse en calidad de resultados a SimRank, sin embargo son mejores en rendimiento computacional. Seguidamente se comparan estas medidas (tres propuestas y SimRank) con dos servicios de recomendación, para intentar analizar si los valores devueltos por las medidas de similitud se aproximan a la percepción de similitud de las personas. Esta investigación comienza definiendo formalmente las medidas de similitud propuestas, resaltando las fortalezas y debilidades de cada una de ellas. Además se presenta una implementación en Spark para cada una de las medidas; dichas implementaciones fueron utilizadas para realizar los experimentos de las siguientes secciones. Finalmente se analiza el rendimiento y calidad de los resultados de cada una de las medidas propuestas, para luego continuar a comparar estas medidas con SimRank, y poder concluir cuáles son los aspectos en que las medidas propuestas superan esta medida base.es_ES
Patrocinadordc.description.sponsorshipInstituto Milenio de Fundamentos de los Datoses_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectWikis (Computación)
Keywordsdc.subjectBases de datos
Keywordsdc.subjectMedidas de similitud
Títulodc.titleSimilitud de entidades en Wikidataes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencias, Mención Computaciónes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States