Las bases de datos de grafos se han posicionado como alternativa válida para programadores que requieren de una base de datos más a la medida para su problema que lo que les ofrecen las bases de datos tradicionales, esto se debe, mayoritariamente, a que las base de datos de grafos proporcionan mayor libertad al momento de definir y modificar schemas, y mayor expresividad en su lenguaje de consulta.
Por otro lado, la poca estructuración que estas bases de datos ofrecen también traen problemas, en especial a sus usuarios finales, los que tendrán mayor dificultad para poder identificar elementos en ésta y así poder navegar estas base de datos de forma eficiente.
En este trabajo de título se busca implementar en MillenniumDB, una nueva base de datos de grafos, búsqueda de texto completo con índices invertidos para mitigar parte del problema previamente mencionado. Con esta nueva funcionalidad, entonces, un usuario no necesitaría conocer previamente identificadores internos para los elementos de una GraphDB, sino que tendrá la posibilidad de buscar y explorarla a través de texto parcial.
Para esté objetivo, se diseñó y desarrolló un índice de texto, para luego implementar su lógica en el motor de MillenniumDB.
Para el diseño y lógica interna del índice primero se realizó una búsqueda preliminar sobre bibliotecas de búsqueda de texto, donde se llego a la conclusión que Lucene++, un \textit{port} de Lucene a C++, era el más adecuado. Luego se implemento la lógica interna del índice utilizando éste \textit{framework}.
Al momento de la validación de la solución desarrollada se consideraron 4 métricas: el tiempo de creación del índice, el tamaño de éste, el tiempo de búsqueda dado el tamaño del índice y el tiempo de consultas en el grafo que incluyen consultas. Las últimas son las que más afectan la experiencia de un usuario final de esta base de datos. Sin embargo esta solución tiene limitaciones al no estar del todo conectada al lenguaje de consultas de MillenniumDB por lo que no es transparente para el usuario final.
Este trabajo presenta una solución a algunos de los problemas que conlleva la utilización de base de datos de grafos para sus usuarios. Así pues como trabajo futuro se propone modificar la sintaxis del lenguaje de consulta para que la utilización de esta solución sea transparente para el usuario final.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States