Detección y clasificación de señales submarinas con técnicas de Machine Learning
Professor Advisor
dc.contributor.advisor
Buchan, Susannah
Author
dc.contributor.author
Hoffmann Vásquez, Reinaldo Cristián
Associate professor
dc.contributor.other
Becerra Yoma, Néstor
Associate professor
dc.contributor.other
Mahu Sinclair, Rodrigo
Admission date
dc.date.accessioned
2021-09-08T12:36:48Z
Available date
dc.date.available
2021-09-08T12:36:48Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/181868
General note
dc.description
Memoria para optar al título de Ingeniero Civil Eléctrico
es_ES
Abstract
dc.description.abstract
En este trabajo se busca detectar y clasificar correctamente eventos presentes en grabaciones submarinas capturadas en las costas de la isla de Juan Fernández, Chile. Para la detección y clasificación se aplican técnicas de machine learning, en particular se utilizan modelos ocultos de Markov (HMM), redes neuronales profundas (DNN) y mezclas de gaussianas (GMM).
Todos los modelos utilizados consisten en un modelo oculto de Markov, cuyas probabilidades de observación son calculadas de dos formas distintas. Primero se prueba utilizando una mezcla de gaussianas para obtener las probabilidades y posteriormente se utiliza una red DNN en su lugar.
Se dispone de 1.381 grabaciones de aproximadamente 10 minutos, correspondiente a 236 horas totales de audio. En las grabaciones aparecen 40.857 eventos distintos de silencio. Se usan 24 clases distintas para realizar la clasificación, entre las que se tienen vocalizaciones de ballenas azules, vocalizaciones de ballenas sei, vocalizaciones de ballenas minke, sonidos provenientes de barcos, sonidos asociados a movimientos sísmicos, entre otros. La base de datos presenta un gran desbalance de clases debido a que gran parte de las grabaciones corresponde a silencio y ruido de fondo.
Para evaluar los resultados se utilizan tres métricas: el porcentaje de clasificaciones correctas total, el porcentaje de clasificaciones correctas de los eventos distintos de silencio y el porcentaje de clasificaciones correctas de los eventos sísmicos. Se calcula el accuracy de este evento en particular debido al interés práctico por las posibles aplicaciones de la detección y clasificación de movimientos sísmicos.
Se obtienen porcentajes de accuracy total de 90% aproximadamente, tanto usando modelos HMM con redes DNN como usando modelos HMM con GMM. El porcentaje de clasificaciones correctas de los eventos sísmicos usando redes DNN es muy alto, superando 97% en varios experimentos. Por otra parte, el porcentaje de clasificaciones correctas de todas las etiquetas distintas de silencio son menores, fluctuando entre 50% y 30% en la mayoría de los experimentos.
Se concluye que el gran desbalance de clases, con la mayoría de los frames correspondientes a silencio, afecta la clasificación de los demás eventos. Los modelos con mezcla de gaussianas entregan un mayor porcentaje de clasificaciones correctas de las etiquetas distintas de silencio y modelos con DNN clasifican de mejor manera los eventos sísmicos, por lo que se concluye que el mejor modelo depende de cuál de estos factores resulta más importante para la aplicación en particular.