Show simple item record

Combinado Indexación y Compresión en Texto Semi-Estructurado

Professor Guidedc.contributor.advisorNavarro Badino, Gonzaloes_CL
Authordc.contributor.authorSologuren Gutiérrez, Felipe Leopoldo es_CL
Staff editordc.contributor.editorFacultad de Ciencias Físicas y Matemáticases_CL
Staff editordc.contributor.editorDepartamento de Ciencias de la Computaciónes_CL
Associate professordc.contributor.otherBustos Cárdenas, Benjamín
Associate professordc.contributor.otherParedes Moraleda, Rodrigo
Admission datedc.date.accessioned2012-09-12T18:17:41Z
Available datedc.date.available2012-09-12T18:17:41Z
Publication datedc.date.issued2009es_CL
Identifierdc.identifier.urihttp://repositorio.uchile.cl/handle/2250/103488
Abstractdc.description.abstractEl almacenamiento digital de la información debe abordar tanto el problema de la incorporación de datos al sistema como su recuperación, y debe hacer un catálogo acorde con las consultas que sobre ellos quiera hacerse. El espacio ocupado para el almacenamiento y el tiempo necesario para ingresar la información, y para recuperala, depende directamente de la estructura utilizada en el repositorio. De este modo, cuando nos referimos a información que ya cuenta cion un grado de estructuración, la indexación debe ser coherente con la estructuta formal de la misma, para favorecer así la consulta. En el presente estudio se aborda el problema de la compresión estática de información semi-estructurada combinada con una indezación tendiente a soportar uin conjunto de consultas sobre los datos, con un fuerte énfasis en el almacenamiento en memoria secundaria. El ámbito de desarrollo de la aplicación propuesta se enmarca dentro de la documentación XML y su lenguaje de consulta XQuery. El modelo utilizado en la implementación está basado en la propuestas desarrolladas por Baeza-Yates y Navarro en Proximal Nodes. La implementación corresponde a un desarrollo posterior de un procesador destinado a soportar consultas en el lenguaje XPath desarrollado por Manuel Ortega como memoria de Ingeniería. El desarrollo de la capa de almacenamiento del prototipo actual se enfoca en la resolución de problemas en tres áreas: recuperación del archivo fuente, consulta eficiente sobre la estructura del documento, y búsqueda de texto en lenguaje natural. Las estructuras diseñadas adhieren a técnicas recientes en el área de la compresión y de recuperación de la información en XML. El resultado de esta memoria es un autoíndice XML con gran desempeño en colecciones de tamaño pequeño y mediano, con capacidad de abordar colecciones de gran tamaño con resucesos limitados de memoria principal, y con un gran potencial de adaptación para colecciones en un nuevo contexto dinámico. El prototipo presenta un desempeño altamente competitivo con las alternativas existentes en el estado del arte.
Lenguagedc.language.isoeses_CL
Publisherdc.publisherUniversidad de Chilees_CL
Publisherdc.publisherPrograma Cybertesises_CL
Type of licensedc.rightsSologuren Gutiérrez, Felipe Leopoldoes_CL
Keywordsdc.subjectComputaciónes_CL
Keywordsdc.subjectIndexaciónes_CL
Keywordsdc.subjectEstructuras de datos (Ciencias de la computación)es_CL
Keywordsdc.subjectXML (Lenguaje de marcación de documentos)es_CL
Keywordsdc.subjectXQuery (Lenguaje de programación de computadores)es_CL
Keywordsdc.subjectEstructuras compactadases_CL
Títulodc.titleCombinado Indexación y Compresión en Texto Semi-Estructuradoes_CL
Document typedc.typeTesises_CL


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record