Sistema visual para explorar subgrafos temáticos en Wikidata
Tesis
![Thumbnail](/themes/Mirage2/images/cubierta.jpg)
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Hogan, Aidan
Cómo citar
Sistema visual para explorar subgrafos temáticos en Wikidata
Professor Advisor
Abstract
Wikidata posee una gran cantidad de información, ya sea de personas, animales, grupos de música, países, etc. Algunos de sus usuarios siguen agregando información nueva, actualizándola e incluyendo fuentes. Los datos que dispone están estructurados, lo que permite que puedan ser leídos automáticamente por ordenadores.
Se pueden realizar consultas sobre los datos de Wikidata. Sin embargo, elaborar estas consultas requiere el conocimiento del lenguaje SPARQL. Esto es una barrera de entrada en el uso para personas que no poseen conocimientos acerca de lenguajes de consulta, lo que les aleja de aprovechar completamente Wikidata.
Con lo anterior en consideración, el objetivo principal de esta memoria es el desarrollo de un sistema visual que permita explorar subgrafos temáticos en Wikidata y obtener eficientemente relaciones. Esto podría acercar el uso de Wikidata a personas que no conocen esta fuente de información o bien no saben acerca del lenguaje de consulta SPARQL.
La creación de los subgrafos consta de desplegar los caminos (nodos y aristas intermedias) entre entidades de Wikidata. Para esto se implementa una estructura de almacenamiento de los datos de Wikidata en memoria principal. A continuación, se desarrolla un algoritmo de búsqueda de caminos entre los nodos (entidades de Wikidata). Finalmente se desarrolla un sistema visual para explorar subgrafos temáticos usando los datos de Wikidata ya almacenados en memoria y el algoritmo propuesto.
La solución implementada se evalúa a nivel de estructura de datos, eficiencia algorítmica y usabilidad. En primera instancia, se evalúan las estructuras de almacenamiento mediante la comparación de su uso de memoria y rapidez de obtención de vecinos de los nodos. Se observan mejores resultados en la estructura que usa arreglos nativos y posee una estructura similar a una lista de adyacencia. Se evalúa el algoritmo de búsqueda de caminos midiendo la cantidad de aristas pertenecientes a caminos que se obtienen en un minuto. El resultado es un algoritmo que posee una mediana que supera las 100 aristas obtenidas en menos de un minuto para caminos de largo 3 (a lo más 3 aristas entre los nodos que se buscan caminos). Por último, se evalúa la aplicación web desarrollada mediante una encuesta de usabilidad. A partir de 80 respuestas voluntarias se obtiene el puntaje promedio de 81,19 en la escala de usabilidad del sistema.
Se plantea como trabajo futuro, evaluar otras estructuras de almacenamiento del grafo, mejorar el aspecto visual para hacerla más amigable con los usuarios y cambiar la arquitectura del servidor, de modo que se pueda tener una máquina que almacene el grafo de Wikidata y otras lleven a cabo las búsquedas de caminos.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Collections
The following license files are associated with this item: