Construcción de un mecanismo de procesamiento de patrones temporales aplicado al reconocimiento de voz
Professor Advisor
dc.contributor.advisor
Velásquez Sandoval, Juan Domingo
Author
dc.contributor.author
Valenzuela Ramírez, Manuel Aníbal
Staff editor
dc.contributor.editor
Facultad de Ciencias Físicas y Matemáticas
Staff editor
dc.contributor.editor
Departamento de Ciencias de la Computación
Associate professor
dc.contributor.other
Bustos Cárdenas, Benjamín
Associate professor
dc.contributor.other
Sánchez Ilabaca, Jaime
Admission date
dc.date.accessioned
2015-11-30T13:43:21Z
Available date
dc.date.available
2015-11-30T13:43:21Z
Publication date
dc.date.issued
2015
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/135331
General note
dc.description
Ingeniero Civil en Computación
Abstract
dc.description.abstract
En el área de desarrollo de software para el control de aplicaciones y dispositivos electrónicos por voz, ha sido cada vez más común implementar mecanismos que cumplan esta función, considerando el procesamiento de señales sonoras para finalmente descubrir patrones que permitan la identificación y el uso de instrucciones.
El objetivo de este trabajo es la exploración de un mecanismo que implemente el procesamiento de la voz humana, extrayendo sus características fundamentales y utilizando estos datos para la identificación de patrones en el tiempo.
La hipótesis fundamental es que en la voz humana existen patrones en el tiempo, que podemos obtener y utilizar para la elaboración de instrucciones a ser ejecutadas por componentes de software.
Para lograr el objetivo se tomó como base la implementación de un mecanismo de obtención de espectros de frecuencias de la voz humana, considerando algoritmos y técnicas basadas en análisis espectral. Para el procesamiento de los patrones se desarrolló un mecanismo basado en redes neuronales, dada la naturaleza vectorial de los datos.
El trabajo, por tanto, se divide en dos grandes tareas. La primera es la obtención de los datos relevantes a la voz, de acuerdo con espectros de frecuencias obtenidos a partir de filtros basados en Wavelet transformadas. La segunda tarea es la implementación de una red neuronal no supervisada, basada en mapas auto-organizativos (SOM), que permita el registro e identificación de patrones en el tiempo.
El resultado de este trabajo es un mecanismo que cumple parcialmente sus objetivos, dados los niveles de identificación de los fonemas y el costo computacional requerido.