Estudio de Técnicas de Selección de Bancos de Filtros Inducidos por Wavelet Packets para Extracción de Características en Reconocimiento de Voz

Pavez Carvelli, Eduardo Hernán

Professor Advisor	dc.contributor.advisor	Silva Sánchez, Jorge	es_CL
Author	dc.contributor.author	Pavez Carvelli, Eduardo Hernán	es_CL
Staff editor	dc.contributor.editor	Facultad de Ciencias Físicas y Matemáticas	es_CL
Staff editor	dc.contributor.editor	Departamento de Ingeniería Eléctrica	es_CL
Associate professor	dc.contributor.other	Agusto Alegría, Héctor
Associate professor	dc.contributor.other	Becerra Yoma, Néstor
Admission date	dc.date.accessioned	2012-09-12T18:18:18Z
Available date	dc.date.available	2012-09-12T18:18:18Z
Publication date	dc.date.issued	2011	es_CL
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/104130
Abstract	dc.description.abstract	En procesamiento de señales y reconocimiento de voz, uno de los principales tópicos es la extracción de características. Dada una señal digitalizada esta se transforma a una más compacta de acuerdo a algún criterio dependiente del problema. Por ejemplo, la voz es extremadamente redundante, y contiene información de múltiples fuentes como identidad del locutor, estado emocional y secuencia fonética. En reconocimiento de voz, se desea extraer características que preserven la discriminabilidad entre unidades acústicas pero tengan menor dimensión que la señal original. En esta memoria se estudiarán metodologías de extracción de características para reconocimiento de voz utilizando criterios de discriminabilidad entre unidades fonéticas. Como punto de partida se considerará la técnica de extracción de características MFCC utilizada en los reconocedores estándar y con ellas se entrenará un reconocedor con el software HTK para la base de datos TIMIT. Los MFCC se implementan con bancos de filtros; usando esa motivación y aprovechando la gran colección de formas de representar señales que permite la transformada Wavelet Packet (WP), se propuso un método de selección de bancos de filtros WP considerando discriminación entre unidades acústicas. La memoria se centrará en aplicar esta metodología y las soluciones que esta entrega para proponer una alternativa a los MFCCs. La forma de evaluar los rendimientos de los distintos métodos será mediante el porcentaje de reconocimiento fonético en un subconjunto de test de TIMIT. La parte teórica del trabajo consiste en estudiar propiedades y formas de aplicar los WP, y como se construyen los sistemas de reconocimiento fonético. En la práctica, en implementar la transformada WP y los WPCC en C++, implementar reconocedores fonéticos en el software HTK, y unir todos estos bloques usando el lenguaje PERL, para correr experimentos en distintos escenarios. El aporte de este trabajo son las características Wavelet Packet Cepstral Coefficients (WPCC), se estipulan criterios concretos de diseño para los bancos de filtros WP, con el objetivo de obtener la mayor información para discriminar fonemas. Los WP obtenidos tienen alta selectividad en frecuencia y una estructura que privilegia la resolución en bajas frecuencias principalmente el rango [200Hz-1000Hz] del espectro acústico.
Lenguage	dc.language.iso	es	es_CL
Publisher	dc.publisher	Universidad de Chile	es_CL
Publisher	dc.publisher	CyberDocs	es_CL
Type of license	dc.rights	Pavez Carvelli, Eduardo Hernán	es_CL
Keywords	dc.subject	Electricidad	es_CL
Keywords	dc.subject	Procesamiento de señales, Técnicas digitales	es_CL
Keywords	dc.subject	Sistemas de procesamiento de la voz	es_CL
Keywords	dc.subject	Wavelet packets	es_CL
Título	dc.title	Estudio de Técnicas de Selección de Bancos de Filtros Inducidos por Wavelet Packets para Extracción de Características en Reconocimiento de Voz	es_CL
Document type	dc.type	Tesis

Files in this item

Name:: cf-pavez_ec.pdf
Size:: 672.0Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Pregrado
Tesis Pregrado

Show simple item record