Caracterización del modelo TitaNet-L de NVIDIA para reconocimiento de hablantes en español
Tesis

Access note
Acceso abierto
Publication date
2024Metadata
Show full item record
Cómo citar
Silva Sánchez, Jorge
Cómo citar
Caracterización del modelo TitaNet-L de NVIDIA para reconocimiento de hablantes en español
Author
Professor Advisor
Abstract
Este trabajo de título se centra en la caracterización y evaluación de un sistema escalable de identificación de hablantes en español, basado en el modelo de representación TitaNet-L, preentrenado en inglés por NVIDIA. Se construyó un dataset utilizando sesiones del Proceso Constituyente chileno de 2023 (PCCh23). Adicionalmente, se ha propuesto una metodología replicable para la caracterización de otros sistemas de representación biométrica basados en encoders neuronales optimizados para la codificación de individuos considerando márgenes angulares interclase.
Los resultados demostraron que el modelo es capaz de generar embeddings consistentes y representativos para cada hablante, y que el clasificador basado en la definición de centroides por clase y similitud coseno permitió una identificación eficiente sin la necesidad de altos volúmenes de datos de enrolamiento ni de grandes recursos de cómputo. Se alcanzó un accuracy de al menos 85\% en problemas con hasta 75 hablantes, utilizando 20 segundos de elocuciones de enrolamiento por locutor. Sin embargo, cuando el tiempo total de datos de enrolamiento supera los 60 segundos, la incorporación de nuevas elocuciones tiende a perjudicar el rendimiento del modelo.
Para el futuro, se sugiere la creación de datasets estandarizados para el reconocimiento de hablantes en español y el desarrollo de clasificadores geométricos más complejos para mejorar la precisión y robustez del sistema.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Eléctrico
Patrocinador
Este trabajo ha sido parcialmente financiado por Unholster S.A
Identifier
URI: https://repositorio.uchile.cl/handle/2250/202594
Collections
The following license files are associated with this item: