El atlas de Wikidata
Professor Advisor
Abstract
En el presente trabajo se muestra el desarrollo de un sistema que permite buscar y geolocalizar instancias de tipos de entidades de Wikidata como por ejemplo: montañas, ríos, museos, obras de arte, centros clandestinos de detención y tortura; entre muchos otros.
En primer lugar, se hizo una revisión de distintos conceptos y herramientas para tener una idea general sobre como funciona el acceso y manejo de los datos del sistema. Entre ellos destacan: Wikidata, SPARQL, y Wikidata Query Service (WDQS). También, se vieron algunas fuentes de datos geográficos como OpenStreetMap y herramientas de visualización como Leaflet que permite la creación de un mapa mundial personalizable. Por último se presentan algunos sistemas geográficos relacionados con Wikidata y con el presente trabajo.
Luego, se presenta el preprocesamiento y análisis de los datos de Wikidata que van a ser utilizados en el sistema. Los resultados generan un JSON con todos los tipos de entidades georreferenciables de Wikidata, vital para la implementación del autocompletado del sistema. También se presenta el acceso a los datos de las instancias de los tipos encontrados utilizando WDQS para obtener sus coordenadas geográficas y más información relevante.
Posteriormente, se muestra la implementación de las distintas partes del sistema y la forma en como estas se comunican entre si generando una arquitectura cliente-servidor. Se verá la implementación de una API Flask que se comunica con los datos obtenidos del análisis y también a los datos que Wikidata provee al utilizar su API. Se explicarán las funcionalidades de autocompletado de búsqueda y los resultados que estas generan. Además, se presentarán las distintas componentes de la interfaz del sistema como la barra de búsqueda y selector de límite, el mapa mundial y el cuadro con resultados de las búsquedas.
Con el sistema funcionando, se realizaron distintos experimentos para medir el rendimiento del mismo. En primer lugar, se realizó una evaluación del preprocesamiento y análisis del dump de Wikidata. Luego, se evaluó el rendimiento tanto para el autocompletado como para la obtención de los resultados para los más de 21 mil tipos que se encontraron. Finalmente, se muestran los resultados de una encuesta completada por usuarios que tuvo el sistema para medir la usabilidad. Finalmente, se concluye sobre los objetivos inicialmente planteados y se exponen los aspectos positivos y negativos del sistema. Se cree que el objetivo de desarrollar un sistema con las características propuestas se cumplió de buena manera, sin embargo, este podría mejorar principalmente en la generación del mapa y su contenido; también se piensa en nuevas funcionalidades para que el sistema sea mucho más atractivo para los usuarios y así sacarle el máximo provecho a la obtención de datos de Wikidata.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/192899
Collections
The following license files are associated with this item: