Filtrado espacial de ruido aditivo para interacción humano robot
Professor Advisor
dc.contributor.advisor
Becerra Yoma, Néstor
Author
dc.contributor.author
Mahu Sinclair, Rodrigo Manuel
Associate professor
dc.contributor.other
Céspedes Umaña, Sandra
Associate professor
dc.contributor.other
Atkinson Abutridy, John
Admission date
dc.date.accessioned
2023-04-10T19:56:23Z
Available date
dc.date.available
2023-04-10T19:56:23Z
Publication date
dc.date.issued
2022
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/192630
Abstract
dc.description.abstract
En el contexto de la interacción humano robot la comunicación mediante voz es de gran importancia. Por esto se requiere mejorar el desarrollo técnicas que permitan un reconocimiento robusto de voz en ambientes ruidosos. Estas técnicas pueden utilizar las capacidades típicas de un robot como son los múltiples sensores audiovisuales.
En este trabajo se aborda el uso de múltiples beamforming apuntando a las fuentes de voz y ruido. En conjunto con técnicas de separación de canal para obtener un mejor reconocimiento.
Esto es posible utilizando robots con arreglos de micrófonos e información visual para detectar la localización de las fuentes.
Las señales de beamforming para fuentes de voz y ruido se consideran como conocidas y se aborda el uso de técnicas de separación de canal y deep learning para mejorar el desempeño del reconocedor de voz.
Se presenta un modelo para abordar la separación de la mezcla de ruido y voz. Esta se compara con otras técnicas de separación de señales y técnicas de deep learning para eliminar
ruido.
Se genera una base datos que represente el problema abordado y se muestran resulta dos utilizando redes neuronales implementadas en TensorFlow. Las señales resultantes son evaluadas utilizando un sistema de reconocimiento de voz en el estado del arte.
El sistema propuesto presenta un desempeño similar a las técnicas en el estado del arte, requiriendo una una menor ventana de análisis.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States