Comparación entre índice invertido y Wavelet Tree como máquinas de búsqueda

González Cornejo, Senén Andrés

Professor Advisor	dc.contributor.advisor	Marín Caihuan, Juan Mauricio	es_CL
Author	dc.contributor.author	González Cornejo, Senén Andrés	es_CL
Staff editor	dc.contributor.editor	Facultad de Ciencias Físicas y Matemáticas	es_CL
Staff editor	dc.contributor.editor	Departamento de Ciencias de la Computación	es_CL
Associate professor	dc.contributor.other	Bustos Cárdenas, Benjamín
Associate professor	dc.contributor.other	Navarro, Gonzalo
Admission date	dc.date.accessioned	2012-09-12T18:17:37Z
Available date	dc.date.available	2012-09-12T18:17:37Z
Publication date	dc.date.issued	2009	es_CL
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/103412
Abstract	dc.description.abstract	Las máquinas de búsqueda para la Web utilizan el índice invertido como estructura de datos que permite acelerar las búsquedas en grandes colecciones de texto. Para lograr tiempos de respuesta por consulta menores al medio segundo, tanto el índice como la colección de texto se particionan en dos grupos de máquinas distintos. Cada consulta se envía al primer grupo, las cuales responden con los documentos más relevantes para esa consulta. Desde estos resultados se seleccionan los documentos más relevantes en forma global. Dichos documentos se envían al segundo grupo de máquinas las cuales extraen de la colección de texto el resumen (o snippet) asociado a cada documento en el resultado y construyen la página Web final a ser presentada al usuario como respuesta a su consulta. En este trabajo de memoria se propone un método alternativo de procesamiento de consultas, el cual ocupa un solo grupo de máquinas para realizar ambas operaciones, es decir, en un solo grupo de máquinas se realiza la determinación de los mejores documentos y la construcción de la página Web de respuesta. Para esto se recurre al uso de estrategias de texto comprimido auto-indexado y memoria cache diseñada para mantener las listas invertidas de los términos más frecuentes en las consultas. El texto comprimido auto-indexado se utiliza para generar de manera on-line las listas invertidas y para generar el resumen asociado a cada documento en la respuesta a una consulta. Los resultados experimentales muestran que en el mismo espacio ocupado por el índice invertido estándar es posible ubicar la memoria cache de listas invertidas y el texto comprimido, y alcanzar la misma tasa de respuestas por unidad de tiempo que se logra con el índice invertido. La ventaja está en que en el nuevo esquema no es necesario el uso del segundo grupo de máquinas, y por lo tanto se logra un mejor uso de los recursos de hardware, lo cual es relevante para la operación económica de los grandes centros de datos para máquinas de búsqueda.
Lenguage	dc.language.iso	es	es_CL
Publisher	dc.publisher	Universidad de Chile	es_CL
Publisher	dc.publisher	CyberDocs	es_CL
Type of license	dc.rights	González Cornejo, Senén Andrés	es_CL
Keywords	dc.subject	Computación	es_CL
Keywords	dc.subject	Buscadores de internet	es_CL
Keywords	dc.subject	Recuperación de información	es_CL
Keywords	dc.subject	Estructuras de datos Ciencia de la computación	es_CL
Título	dc.title	Comparación entre índice invertido y Wavelet Tree como máquinas de búsqueda	es_CL
Document type	dc.type	Tesis

Files in this item

Name:: cf-gonzales_sc.pdf
Size:: 28.22Mb
Format:: PDF

This item appears in the following Collection(s)

Tesis Pregrado
Tesis Pregrado

Show simple item record