Identificación automática de cantantes de principio a fin utilizando formas de onda
Professor Advisor
dc.contributor.advisor
Pérez Rojas, Jorge
Author
dc.contributor.author
Oyanedel Muñoz, Vicente Alberto
Associate professor
dc.contributor.other
Baloian Tataryan, Nelson
Associate professor
dc.contributor.other
Palma Lizana, Mauricio
Associate professor
dc.contributor.other
Medina Daza, Leonel
Admission date
dc.date.accessioned
2021-08-16T14:24:51Z
Available date
dc.date.available
2021-08-16T14:24:51Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/181245
General note
dc.description
Tesis para optar al grado de Magíster en Ciencias, Mención Computación
es_ES
General note
dc.description
Memoria pata optar al título de Ingeniero Civil en Computación
Abstract
dc.description.abstract
Singer Identification (en adelante, SID) es una tarea de clasificación de audio que consiste en determinar el vocalista quién canta en un segmento de audio de una canción musical.
En el pasado reciente, se han propuesto varias técnicas informáticas basadas en Aprendizaje de Máquinas para resolver SID de manera automática. La mayoría de éstas soluciones se derivan de la disciplina Speaker Recognition, y utilizan descriptores para resumir el documento de audio por medio de representaciones derivadas de la forma de onda del sonido elaboradas por medio de Ingeniería de Características. En cambio, los humanos logramos reconocer voces conocidas con facilidad y de principio a fin, percibiendo directamente las ondas acústicas a través de nuestro oído.
En este trabajo propusimos una arquitectura de Deep Learning denominada EWC que se aplica de principio a fin sobre el audio en su forma más cruda: La forma de onda. Evaluamos su competitividad relativa a otras soluciones a SID propuestas en trabajos relacionados, y obtuvimos mejoras absolutas de hasta un 11% en métricas Accuracy, Precision, Recall y F1-Score, en comparación a métodos del estado-del-arte en la tarea.
A lo mejor de nuestro conocimiento, la arquitectura EWC que desarrollamos es la primera que logra resolver SID sin recurrir a descriptores, es decir, de principio a fin utilizando la forma de onda directamente como entrada al sistema.