Filtrado espacial de ruido aditivo para interacción humano robot
Tesis
Access note
Acceso abierto
Publication date
2022Metadata
Show full item record
Cómo citar
Becerra Yoma, Néstor
Cómo citar
Filtrado espacial de ruido aditivo para interacción humano robot
Author
Professor Advisor
Abstract
En el contexto de la interacción humano robot la comunicación mediante voz es de gran importancia. Por esto se requiere mejorar el desarrollo técnicas que permitan un reconocimiento robusto de voz en ambientes ruidosos. Estas técnicas pueden utilizar las capacidades típicas de un robot como son los múltiples sensores audiovisuales.
En este trabajo se aborda el uso de múltiples beamforming apuntando a las fuentes de voz y ruido. En conjunto con técnicas de separación de canal para obtener un mejor reconocimiento.
Esto es posible utilizando robots con arreglos de micrófonos e información visual para detectar la localización de las fuentes.
Las señales de beamforming para fuentes de voz y ruido se consideran como conocidas y se aborda el uso de técnicas de separación de canal y deep learning para mejorar el desempeño del reconocedor de voz.
Se presenta un modelo para abordar la separación de la mezcla de ruido y voz. Esta se compara con otras técnicas de separación de señales y técnicas de deep learning para eliminar
ruido.
Se genera una base datos que represente el problema abordado y se muestran resulta dos utilizando redes neuronales implementadas en TensorFlow. Las señales resultantes son evaluadas utilizando un sistema de reconocimiento de voz en el estado del arte.
El sistema propuesto presenta un desempeño similar a las técnicas en el estado del arte, requiriendo una una menor ventana de análisis.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Eléctrica
Identifier
URI: https://repositorio.uchile.cl/handle/2250/192630
Collections
The following license files are associated with this item: