Cancelación de ruido y reverberación para reconocimiento de voz en interacción humano robot

Correa Álvarez, Pedro José

Professor Advisor	dc.contributor.advisor	Becerra Yoma, Néstor
Author	dc.contributor.author	Correa Álvarez, Pedro José
Associate professor	dc.contributor.other	Silva Sánchez, Jorge
Associate professor	dc.contributor.other	Mahu Sinclair, Rodrigo
Admission date	dc.date.accessioned	2020-04-17T04:12:32Z
Available date	dc.date.available	2020-04-17T04:12:32Z
Publication date	dc.date.issued	2020
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/173932
General note	dc.description	Memoria para optar al título de Ingeniero Civil Eléctrico	es_ES
Abstract	dc.description.abstract	Actualmente las tecnologías de reconocimiento automático de voz tienen un rol protagónico en el desarrollo de plataformas para la interacción entre personas y sistemas robóticos. Considerando que el lenguaje hablado es la principal forma de comunicación entre los seres humanos, el desarrollo de estas plataformas ha apuntado a imitar dicha forma de comunicación, y se ha traducido en populares aplicaciones como Siri o Google Now. De la misma manera, en el área de interacción humano robot el reconocimiento automático de voz es crucial, y en este contexto se suele contar con una serie de sensores. Los robots normalmente están equipados con arreglos de micrófonos, además de cámaras de video y térmicas, radares, sonares, entre otros. Esto entrega una amplia gama de posibilidades para mejorar el desempeño de las distintas tecnologías que han sido implementadas en ellos, particularmente las de reconocimiento de voz. En esta Memoria de Título se ha trabajado sobre señales distorsionadas con ruido y reverberación, simulando escenarios típicos de interacción humano robot. Con el fin de mejorar el desempeño del reconocimiento automático de voz, se han implementado redes neuronales artificiales y otras técnicas de procesamiento de audio que permiten reducir el efecto del ruido y la reverberación. Para esto, se utilizó Tensorflow, una librería de libre acceso para Python que permite la programación de redes neuronales artificiales. Hecho esto, se comparan los sistemas implementados en base a su desempeño en un sistema de reconocimiento automático de voz. Por último, se ha concluido en base a los resultados obtenidos en las distintas etapas de la investigación. Para el caso de la reverberación, se compara el desempeño de una red neuronal LSTM y el método WPE, siendo este último el que da mejores resultados. Por otra parte, para la reducción de ruido se implementó una red neuronal feedforward, y se probaron distintas formas de normalización sobre los datos. Se observó que ciertas normalizaciones permiten mejoras considerables en el desempeño del reconocedor de voz.	es_ES
Lenguage	dc.language.iso	es	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Chile	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/cl/	*
Keywords	dc.subject	Reconocimiento automático de la voz	es_ES
Keywords	dc.subject	Contaminación acústica	es_ES
Keywords	dc.subject	Control del ruido	es_ES
Keywords	dc.subject	Redes neuronales (Ciencia de la computación)	es_ES
Título	dc.title	Cancelación de ruido y reverberación para reconocimiento de voz en interacción humano robot	es_ES
Document type	dc.type	Tesis
Cataloguer	uchile.catalogador	gmm	es_ES
Department	uchile.departamento	Departamento de Ingeniería Eléctrica	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES

Files in this item

Name:: cf-correa_pa.pdf
Size:: 2.853Mb
Format:: PDF

This item appears in the following Collection(s)

Tesis Pregrado
Tesis Pregrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile