Sistema visual para explorar subgrafos temáticos en Wikidata
Professor Advisor
dc.contributor.advisor
Hogan, Aidan
Author
dc.contributor.author
Torres Gutiérrez, Cristóbal Patricio
Associate professor
dc.contributor.other
Navarro Badino, Gonzalo
Associate professor
dc.contributor.other
Frez Pulgar, Rodrigo
Admission date
dc.date.accessioned
2024-01-18T17:46:03Z
Available date
dc.date.available
2024-01-18T17:46:03Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.other
10.58011/kyas-y363
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/197021
Abstract
dc.description.abstract
Wikidata posee una gran cantidad de información, ya sea de personas, animales, grupos de música, países, etc. Algunos de sus usuarios siguen agregando información nueva, actualizándola e incluyendo fuentes. Los datos que dispone están estructurados, lo que permite que puedan ser leídos automáticamente por ordenadores.
Se pueden realizar consultas sobre los datos de Wikidata. Sin embargo, elaborar estas consultas requiere el conocimiento del lenguaje SPARQL. Esto es una barrera de entrada en el uso para personas que no poseen conocimientos acerca de lenguajes de consulta, lo que les aleja de aprovechar completamente Wikidata.
Con lo anterior en consideración, el objetivo principal de esta memoria es el desarrollo de un sistema visual que permita explorar subgrafos temáticos en Wikidata y obtener eficientemente relaciones. Esto podría acercar el uso de Wikidata a personas que no conocen esta fuente de información o bien no saben acerca del lenguaje de consulta SPARQL.
La creación de los subgrafos consta de desplegar los caminos (nodos y aristas intermedias) entre entidades de Wikidata. Para esto se implementa una estructura de almacenamiento de los datos de Wikidata en memoria principal. A continuación, se desarrolla un algoritmo de búsqueda de caminos entre los nodos (entidades de Wikidata). Finalmente se desarrolla un sistema visual para explorar subgrafos temáticos usando los datos de Wikidata ya almacenados en memoria y el algoritmo propuesto.
La solución implementada se evalúa a nivel de estructura de datos, eficiencia algorítmica y usabilidad. En primera instancia, se evalúan las estructuras de almacenamiento mediante la comparación de su uso de memoria y rapidez de obtención de vecinos de los nodos. Se observan mejores resultados en la estructura que usa arreglos nativos y posee una estructura similar a una lista de adyacencia. Se evalúa el algoritmo de búsqueda de caminos midiendo la cantidad de aristas pertenecientes a caminos que se obtienen en un minuto. El resultado es un algoritmo que posee una mediana que supera las 100 aristas obtenidas en menos de un minuto para caminos de largo 3 (a lo más 3 aristas entre los nodos que se buscan caminos). Por último, se evalúa la aplicación web desarrollada mediante una encuesta de usabilidad. A partir de 80 respuestas voluntarias se obtiene el puntaje promedio de 81,19 en la escala de usabilidad del sistema.
Se plantea como trabajo futuro, evaluar otras estructuras de almacenamiento del grafo, mejorar el aspecto visual para hacerla más amigable con los usuarios y cambiar la arquitectura del servidor, de modo que se pueda tener una máquina que almacene el grafo de Wikidata y otras lleven a cabo las búsquedas de caminos.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States