Show simple item record

Professor Advisordc.contributor.advisorHogan, Aidan
Authordc.contributor.authorBerrocal Contreras, José Ignacio
Associate professordc.contributor.otherBustos Cárdenas, Benjamín
Associate professordc.contributor.otherBarrios Núñez, Juan
Admission datedc.date.accessioned2022-11-25T14:54:45Z
Available datedc.date.available2022-11-25T14:54:45Z
Publication datedc.date.issued2022
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/189398
Abstractdc.description.abstractLas bases de datos de grafos se han posicionado como alternativa válida para programadores que requieren de una base de datos más a la medida para su problema que lo que les ofrecen las bases de datos tradicionales, esto se debe, mayoritariamente, a que las base de datos de grafos proporcionan mayor libertad al momento de definir y modificar schemas, y mayor expresividad en su lenguaje de consulta. Por otro lado, la poca estructuración que estas bases de datos ofrecen también traen problemas, en especial a sus usuarios finales, los que tendrán mayor dificultad para poder identificar elementos en ésta y así poder navegar estas base de datos de forma eficiente. En este trabajo de título se busca implementar en MillenniumDB, una nueva base de datos de grafos, búsqueda de texto completo con índices invertidos para mitigar parte del problema previamente mencionado. Con esta nueva funcionalidad, entonces, un usuario no necesitaría conocer previamente identificadores internos para los elementos de una GraphDB, sino que tendrá la posibilidad de buscar y explorarla a través de texto parcial. Para esté objetivo, se diseñó y desarrolló un índice de texto, para luego implementar su lógica en el motor de MillenniumDB. Para el diseño y lógica interna del índice primero se realizó una búsqueda preliminar sobre bibliotecas de búsqueda de texto, donde se llego a la conclusión que Lucene++, un \textit{port} de Lucene a C++, era el más adecuado. Luego se implemento la lógica interna del índice utilizando éste \textit{framework}. Al momento de la validación de la solución desarrollada se consideraron 4 métricas: el tiempo de creación del índice, el tamaño de éste, el tiempo de búsqueda dado el tamaño del índice y el tiempo de consultas en el grafo que incluyen consultas. Las últimas son las que más afectan la experiencia de un usuario final de esta base de datos. Sin embargo esta solución tiene limitaciones al no estar del todo conectada al lenguaje de consultas de MillenniumDB por lo que no es transparente para el usuario final. Este trabajo presenta una solución a algunos de los problemas que conlleva la utilización de base de datos de grafos para sus usuarios. Así pues como trabajo futuro se propone modificar la sintaxis del lenguaje de consulta para que la utilización de esta solución sea transparente para el usuario final.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectBúsqueda en base de datos
Keywordsdc.subjectTeoría de grafos
Keywordsdc.subjectBases de datos de grafos
Keywordsdc.subjectMillenniumDB
Títulodc.titleBúsqueda de texto en Millenniumdbes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil en Computaciónes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States