Show simple item record

Professor Guidedc.contributor.advisorMarín Caihuan, Juan Mauricioes_CL
Authordc.contributor.authorGonzález Cornejo, Senén Andrés es_CL
Staff editordc.contributor.editorFacultad de Ciencias Físicas y Matemáticases_CL
Staff editordc.contributor.editorDepartamento de Ciencias de la Computaciónes_CL
Associate professordc.contributor.otherBustos Cárdenas, Benjamín
Associate professordc.contributor.otherNavarro, Gonzalo 
Admission datedc.date.accessioned2012-09-12T18:17:37Z
Available datedc.date.available2012-09-12T18:17:37Z
Publication datedc.date.issued2009es_CL
Identifierdc.identifier.urihttp://repositorio.uchile.cl/handle/2250/103412
Abstractdc.description.abstractLas máquinas de búsqueda para la Web utilizan el índice invertido como estructura de datos que permite acelerar las búsquedas en grandes colecciones de texto. Para lograr tiempos de respuesta por consulta menores al medio segundo, tanto el índice como la colección de texto se particionan en dos grupos de máquinas distintos. Cada consulta se envía al primer grupo, las cuales responden con los documentos más relevantes para esa consulta. Desde estos resultados se seleccionan los documentos más relevantes en forma global. Dichos documentos se envían al segundo grupo de máquinas las cuales extraen de la colección de texto el resumen (o snippet) asociado a cada documento en el resultado y construyen la página Web final a ser presentada al usuario como respuesta a su consulta. En este trabajo de memoria se propone un método alternativo de procesamiento de consultas, el cual ocupa un solo grupo de máquinas para realizar ambas operaciones, es decir, en un solo grupo de máquinas se realiza la determinación de los mejores documentos y la construcción de la página Web de respuesta. Para esto se recurre al uso de estrategias de texto comprimido auto-indexado y memoria cache diseñada para mantener las listas invertidas de los términos más frecuentes en las consultas. El texto comprimido auto-indexado se utiliza para generar de manera on-line las listas invertidas y para generar el resumen asociado a cada documento en la respuesta a una consulta. Los resultados experimentales muestran que en el mismo espacio ocupado por el índice invertido estándar es posible ubicar la memoria cache de listas invertidas y el texto comprimido, y alcanzar la misma tasa de respuestas por unidad de tiempo que se logra con el índice invertido. La ventaja está en que en el nuevo esquema no es necesario el uso del segundo grupo de máquinas, y por lo tanto se logra un mejor uso de los recursos de hardware, lo cual es relevante para la operación económica de los grandes centros de datos para máquinas de búsqueda.
Lenguagedc.language.isoeses_CL
Publisherdc.publisherUniversidad de Chilees_CL
Publisherdc.publisherCyberDocses_CL
Type of licensedc.rightsGonzález Cornejo, Senén Andréses_CL
Keywordsdc.subjectComputaciónes_CL
Keywordsdc.subjectBuscadores de internetes_CL
Keywordsdc.subjectRecuperación de informaciónes_CL
Keywordsdc.subjectEstructuras de datos Ciencia de la computaciónes_CL
Títulodc.titleComparación entre índice invertido y Wavelet Tree como máquinas de búsquedaes_CL
Document typedc.typeTesises_CL


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record