Poniendo las ciencias de la computación en el mapa: desarrollando un sistema para geolocalizar investigación
Professor Advisor
dc.contributor.advisor
Hogan, Aidan
Author
dc.contributor.author
Manen Núñez, Felipe Nicolás
Associate professor
dc.contributor.other
Bravo Márquez, Felipe
Associate professor
dc.contributor.other
Perovich Gerosa, Daniel
Admission date
dc.date.accessioned
2021-06-29T15:48:12Z
Available date
dc.date.available
2021-06-29T15:48:12Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/180315
General note
dc.description
Memoria para optar al título de Ingeniero Civil en Computación
es_ES
Abstract
dc.description.abstract
En el presente trabajo se muestra el desarrollo de un sistema que permite geolocalizar
artículos de ciencias de la computación. Este sistema se pensó desde la ausencia de sistemas en la web que tengan la característica de agrupar publicaciones científicas con respecto al lugar de origen o trabajo de sus autores. Se cree que un sistema con esta cualidad podría fomentar la colaboración entre expertos de un área, mejorar la organización de conferencias y ayudar a investigadores en la elección de lugares para estudiar o trabajar. Para lograr esto, se propusieron los objetivos específicos de obtener datos adecuados para resolver el problema, crear métodos para agrupar publicaciones según su geolocalización o por sus temas de investigación y, finalmente, desarrollar interfaces amigables para usuarios.
Para la realización de este trabajo, en primer lugar, se hizo una revisión de distintas herramientas y sistemas que tenían relación con el tema. Entre éstas se destacan fuentes de datos como DBLP, Open Academic Graph y Semantic Scholar. También se vieron algunas alternativas que podrían ser de utilidad para geolocalizar información como herramientas de entity linking y Wikidata. A su vez se presentan alternativas para visualizaciones como OpenStreetMap y Leaflet.
Luego, se presentan las tres partes principales del sistema. La primera consistió en una
preparación de los datos. Se utilizó la fuente de DBLP, que provee información sobre publicaciones, conferencias y autores de ciencias de la computación. A los datos correspondientes a publicaciones se les asignó una afiliación mediante un algoritmo y luego, utilizando la herramienta de entity linking OpenTapioca en conjunto con Wikidata, se logró hacer la geolocalización de estas afiliaciones. La segunda parte del trabajo tenía relación con indexación de estos datos en el motor de búsqueda utilizado Elasticsearch, el cual cumpliría con la función de realizar búsquedas de manera eficiente sobre temas de investigación del área. Como tercera parte se muestra el desarrollo del frontend y la experiencia de usuario. Para esto se utilizó el framework Django vinculado con Elasticsearch. La visualización principal del sistema consistió en un mapa, creado con la librería Leaflet, que entrega afiliaciones en todo el mundo que hayan participado en la escritura de un artículo sobre un tema inicialmente consultado.
Una vez que el sistema estuvo desarrollado, se muestra la evaluación de todas las partes
importantes de él. Se evalúa la precisión del algoritmo para asignar afiliaciones, se compara el rendimiento de distintas herramientas de entity linking, se ve el desempeño de los tiempos de respuesta del sistema y se muestran los resultados de un cuestionario hecho a usuarios para ver su percepción. Con esta evaluación se pudo finalmente concluir sobre los objetivos inicialmente planteados. Se cree que el objetivo de desarrollar un sistema con las características propuestas se cumplió. Sin embargo, algunos objetivos específicos no fueron satisfechos en su totalidad.