Show simple item record

Professor Advisordc.contributor.advisorSilva Sánchez, Jorge
Authordc.contributor.authorOñate Oyaneder, Eduardo Alexis
Associate professordc.contributor.otherHuneeus Lagos, Cristóbal
Associate professordc.contributor.otherSilva Madrid, Álvaro
Associate professordc.contributor.otherZañartu Salas, Matías
Admission datedc.date.accessioned2025-01-03T15:00:58Z
Available datedc.date.available2025-01-03T15:00:58Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/202594
Abstractdc.description.abstractEste trabajo de título se centra en la caracterización y evaluación de un sistema escalable de identificación de hablantes en español, basado en el modelo de representación TitaNet-L, preentrenado en inglés por NVIDIA. Se construyó un dataset utilizando sesiones del Proceso Constituyente chileno de 2023 (PCCh23). Adicionalmente, se ha propuesto una metodología replicable para la caracterización de otros sistemas de representación biométrica basados en encoders neuronales optimizados para la codificación de individuos considerando márgenes angulares interclase. Los resultados demostraron que el modelo es capaz de generar embeddings consistentes y representativos para cada hablante, y que el clasificador basado en la definición de centroides por clase y similitud coseno permitió una identificación eficiente sin la necesidad de altos volúmenes de datos de enrolamiento ni de grandes recursos de cómputo. Se alcanzó un accuracy de al menos 85\% en problemas con hasta 75 hablantes, utilizando 20 segundos de elocuciones de enrolamiento por locutor. Sin embargo, cuando el tiempo total de datos de enrolamiento supera los 60 segundos, la incorporación de nuevas elocuciones tiende a perjudicar el rendimiento del modelo. Para el futuro, se sugiere la creación de datasets estandarizados para el reconocimiento de hablantes en español y el desarrollo de clasificadores geométricos más complejos para mejorar la precisión y robustez del sistema.es_ES
Patrocinadordc.description.sponsorshipEste trabajo ha sido parcialmente financiado por Unholster S.Aes_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleCaracterización del modelo TitaNet-L de NVIDIA para reconocimiento de hablantes en españoles_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Eléctricaes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Eléctricoes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States