Evaluación del efecto de visual servoing en speech enhancement con arreglo de micrófonos lineal en interacción humano-robot móvil
Professor Advisor
dc.contributor.advisor
Becerra Yoma, Néstor
Author
dc.contributor.author
Díaz Albornoz, Alejandro Patricio
Associate professor
dc.contributor.other
Azurdia Meza, César
Associate professor
dc.contributor.other
Carrasco Zambrano, Miguel
Admission date
dc.date.accessioned
2022-06-23T14:56:32Z
Available date
dc.date.available
2022-06-23T14:56:32Z
Publication date
dc.date.issued
2022
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/186197
Abstract
dc.description.abstract
Este trabajo de tesis estudia la comunicación por voz entre humano y robot en ambientes
acústicos desafiantes en contexto de interacción humano robot. En un primer capítulo se
estudia el efecto de usar visual servoing con beamforming para mejorar el reconocimiento de
voz en un sistema de reconocimiento automático de voz. Se grabaron señales de audio con
una plataforma robótica en un escenario real con diferentes condiciones de ruido adicional
y de movimiento del robot para simular una interacción real. Mediante el uso de informa-
ción visual, se controló parte de los movimientos de la plataforma robótica para obtener un
filtrado espacial mejorado, usando beamforming. Esto se logró manteniendo un arreglo de
micrófonos lineal cercano a la posición donde se obtiene la mejor respuesta. Luego en un
siguiente capítulo, se implementó una red neuronal convolucional para enfrentar el problema
de speech enhancement para obtener una estimación limpia de la voz a partir de señales voz
ruidosas y reverberantes. Este capítulo está basado en el escenario del capítulo anterior donde
se considera la plataforma robótica en un ambiente acústico dinámico, ruidoso y reverberan-
te. En este capítulo se realizaron simulaciones y se crearon bases de datos representativas
del problema. Utilizando una mezcla de señales obtenidas a través de beamforming se realizó
speech enhancement a las señales para obtener una versión limpia de la señales reverberantes.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States