Detección y clasificación de señales submarinas con técnicas de Machine Learning
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Buchan, Susannah
Cómo citar
Detección y clasificación de señales submarinas con técnicas de Machine Learning
Professor Advisor
Abstract
En este trabajo se busca detectar y clasificar correctamente eventos presentes en grabaciones submarinas capturadas en las costas de la isla de Juan Fernández, Chile. Para la detección y clasificación se aplican técnicas de machine learning, en particular se utilizan modelos ocultos de Markov (HMM), redes neuronales profundas (DNN) y mezclas de gaussianas (GMM).
Todos los modelos utilizados consisten en un modelo oculto de Markov, cuyas probabilidades de observación son calculadas de dos formas distintas. Primero se prueba utilizando una mezcla de gaussianas para obtener las probabilidades y posteriormente se utiliza una red DNN en su lugar.
Se dispone de 1.381 grabaciones de aproximadamente 10 minutos, correspondiente a 236 horas totales de audio. En las grabaciones aparecen 40.857 eventos distintos de silencio. Se usan 24 clases distintas para realizar la clasificación, entre las que se tienen vocalizaciones de ballenas azules, vocalizaciones de ballenas sei, vocalizaciones de ballenas minke, sonidos provenientes de barcos, sonidos asociados a movimientos sísmicos, entre otros. La base de datos presenta un gran desbalance de clases debido a que gran parte de las grabaciones corresponde a silencio y ruido de fondo.
Para evaluar los resultados se utilizan tres métricas: el porcentaje de clasificaciones correctas total, el porcentaje de clasificaciones correctas de los eventos distintos de silencio y el porcentaje de clasificaciones correctas de los eventos sísmicos. Se calcula el accuracy de este evento en particular debido al interés práctico por las posibles aplicaciones de la detección y clasificación de movimientos sísmicos.
Se obtienen porcentajes de accuracy total de 90% aproximadamente, tanto usando modelos HMM con redes DNN como usando modelos HMM con GMM. El porcentaje de clasificaciones correctas de los eventos sísmicos usando redes DNN es muy alto, superando 97% en varios experimentos. Por otra parte, el porcentaje de clasificaciones correctas de todas las etiquetas distintas de silencio son menores, fluctuando entre 50% y 30% en la mayoría de los experimentos.
Se concluye que el gran desbalance de clases, con la mayoría de los frames correspondientes a silencio, afecta la clasificación de los demás eventos. Los modelos con mezcla de gaussianas entregan un mayor porcentaje de clasificaciones correctas de las etiquetas distintas de silencio y modelos con DNN clasifican de mejor manera los eventos sísmicos, por lo que se concluye que el mejor modelo depende de cuál de estos factores resulta más importante para la aplicación en particular.
General note
Memoria para optar al título de Ingeniero Civil Eléctrico
Patrocinador
Fondecyt bajo el proyecto Iniciación 11190597
Identifier
URI: https://repositorio.uchile.cl/handle/2250/181868
Collections
The following license files are associated with this item: