Identificación automática de cantantes de principio a fin utilizando formas de onda
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Pérez Rojas, Jorge
Cómo citar
Identificación automática de cantantes de principio a fin utilizando formas de onda
Author
Professor Advisor
Abstract
Singer Identification (en adelante, SID) es una tarea de clasificación de audio que consiste en determinar el vocalista quién canta en un segmento de audio de una canción musical.
En el pasado reciente, se han propuesto varias técnicas informáticas basadas en Aprendizaje de Máquinas para resolver SID de manera automática. La mayoría de éstas soluciones se derivan de la disciplina Speaker Recognition, y utilizan descriptores para resumir el documento de audio por medio de representaciones derivadas de la forma de onda del sonido elaboradas por medio de Ingeniería de Características. En cambio, los humanos logramos reconocer voces conocidas con facilidad y de principio a fin, percibiendo directamente las ondas acústicas a través de nuestro oído.
En este trabajo propusimos una arquitectura de Deep Learning denominada EWC que se aplica de principio a fin sobre el audio en su forma más cruda: La forma de onda. Evaluamos su competitividad relativa a otras soluciones a SID propuestas en trabajos relacionados, y obtuvimos mejoras absolutas de hasta un 11% en métricas Accuracy, Precision, Recall y F1-Score, en comparación a métodos del estado-del-arte en la tarea.
A lo mejor de nuestro conocimiento, la arquitectura EWC que desarrollamos es la primera que logra resolver SID sin recurrir a descriptores, es decir, de principio a fin utilizando la forma de onda directamente como entrada al sistema.
General note
Tesis para optar al grado de Magíster en Ciencias, Mención Computación Memoria pata optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/181245
Collections
The following license files are associated with this item: