Poniendo las ciencias de la computación en el mapa: desarrollando un sistema para geolocalizar investigación
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Hogan, Aidan
Cómo citar
Poniendo las ciencias de la computación en el mapa: desarrollando un sistema para geolocalizar investigación
Author
Professor Advisor
Abstract
En el presente trabajo se muestra el desarrollo de un sistema que permite geolocalizar
artículos de ciencias de la computación. Este sistema se pensó desde la ausencia de sistemas en la web que tengan la característica de agrupar publicaciones científicas con respecto al lugar de origen o trabajo de sus autores. Se cree que un sistema con esta cualidad podría fomentar la colaboración entre expertos de un área, mejorar la organización de conferencias y ayudar a investigadores en la elección de lugares para estudiar o trabajar. Para lograr esto, se propusieron los objetivos específicos de obtener datos adecuados para resolver el problema, crear métodos para agrupar publicaciones según su geolocalización o por sus temas de investigación y, finalmente, desarrollar interfaces amigables para usuarios.
Para la realización de este trabajo, en primer lugar, se hizo una revisión de distintas herramientas y sistemas que tenían relación con el tema. Entre éstas se destacan fuentes de datos como DBLP, Open Academic Graph y Semantic Scholar. También se vieron algunas alternativas que podrían ser de utilidad para geolocalizar información como herramientas de entity linking y Wikidata. A su vez se presentan alternativas para visualizaciones como OpenStreetMap y Leaflet.
Luego, se presentan las tres partes principales del sistema. La primera consistió en una
preparación de los datos. Se utilizó la fuente de DBLP, que provee información sobre publicaciones, conferencias y autores de ciencias de la computación. A los datos correspondientes a publicaciones se les asignó una afiliación mediante un algoritmo y luego, utilizando la herramienta de entity linking OpenTapioca en conjunto con Wikidata, se logró hacer la geolocalización de estas afiliaciones. La segunda parte del trabajo tenía relación con indexación de estos datos en el motor de búsqueda utilizado Elasticsearch, el cual cumpliría con la función de realizar búsquedas de manera eficiente sobre temas de investigación del área. Como tercera parte se muestra el desarrollo del frontend y la experiencia de usuario. Para esto se utilizó el framework Django vinculado con Elasticsearch. La visualización principal del sistema consistió en un mapa, creado con la librería Leaflet, que entrega afiliaciones en todo el mundo que hayan participado en la escritura de un artículo sobre un tema inicialmente consultado.
Una vez que el sistema estuvo desarrollado, se muestra la evaluación de todas las partes
importantes de él. Se evalúa la precisión del algoritmo para asignar afiliaciones, se compara el rendimiento de distintas herramientas de entity linking, se ve el desempeño de los tiempos de respuesta del sistema y se muestran los resultados de un cuestionario hecho a usuarios para ver su percepción. Con esta evaluación se pudo finalmente concluir sobre los objetivos inicialmente planteados. Se cree que el objetivo de desarrollar un sistema con las características propuestas se cumplió. Sin embargo, algunos objetivos específicos no fueron satisfechos en su totalidad.
General note
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/180315
Collections
The following license files are associated with this item: