Robustez a Efectos de Canal en Verificación de Locutor
Tesis
Open/ Download
Publication date
2009Metadata
Show full item record
Cómo citar
Becerra Yoma, Néstor
Cómo citar
Robustez a Efectos de Canal en Verificación de Locutor
Author
Professor Advisor
Abstract
Se denomina verificación de locutor a la tarea de aceptar o rechazar la identidad que un determinado usuario declara tener mediante la información extraída de su voz. Este tipo de aplicación toma especial interés cuando es operado sobre la red telefónica pues otorga una interfaz hombre-máquina de gran naturalidad para las personas. Sin embargo, para que un sistema de este tipo sea comercialmente atractivo, debe exhibir un rendimiento acorde a las exigencias de seguridad de la aplicación a ser implementada. Finalmente, la plataforma debe ser robusta a efectos indeseados como son el ruido y en especial el mismatch de canal.
El mismatch de canal es la condición a la cual es sometido un motor verificador de locutor donde las etapas de entrenamiento y de verificación son realizadas mediante canales de transmisión distintos, considerando el canal transmisor como la suma del aparato telefónico más el medio de comunicación. Dicha condición es uno de los factores que más degradan el desempeño de un sistema verificador de locutor, más aun si este es operado sobre la red telefónica.
Para otorgar robustez al motor verificador frente a la distorsión de canal, se realizaron experimentos con tres técnicas implementadas durante este proyecto. El primer método propuesto es una transformación de parámetros que actúa en el dominio del espectro de log-energía del banco de filtros Mel, capaz de reducir la tasa de error del sistema hasta en un 9% al ser aplicado solo y en un 41,5% al ser combinada con un procedimiento clásico tal como CMN (Cepstral Mean Normalization). La segunda propuesta consiste en un filtro pasa bandas aplicado en el espacio del espectro de las trayectorias temporales de log-energía del banco de filtros Mel, con el cual se logran reducciones en la tasa de error de 10,4% y 5,5% considerando y sin considerar mismatch de canal, respectivamente. Finalmente se plantea un método de normalización y compensación de scores basado en la selección automática del canal, procedimiento con el cual se logran mejoras del orden del 40% en el error del motor verificador.
Identifier
URI: https://repositorio.uchile.cl/handle/2250/103320
Collections