Diseño y construcción de modelo de clasificación de incidentes de seguridad usando NLP en los registros de texto escrito para automatizar etiquetación
Professor Advisor
dc.contributor.advisor
Contreras Fuentes, Astrid
Author
dc.contributor.author
Muñoz Cáceres, Pamela Andrea
Associate professor
dc.contributor.other
Calisto Leiva, Ignacio
Associate professor
dc.contributor.other
Jofré Rojas, Enrique
Admission date
dc.date.accessioned
2020-10-03T00:52:15Z
Available date
dc.date.available
2020-10-03T00:52:15Z
Publication date
dc.date.issued
2020
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/176979
General note
dc.description
Memoria para optar al título de Ingeniera Civil Industrial
es_ES
Abstract
dc.description.abstract
La seguridad en minería es un tema de vital importancia, los accidentes son muchas veces fatales, lo que trae consecuencias económicas a las empresas y, más importante aún, afecta a todo el entorno familiar del involucrado. Por lo antes mencionado se toman diversas medidas de control para evitar cualquier tipo de accidente, entre ellas el registro de OPS, tema central del informe.
OPS es la abreviación de Observación Preventiva de Seguridad, son observaciones realizadas por trabajadores con respecto al comportamiento de otros en relación a la seguridad. La mayor parte de este registro corresponde a data no estructurada, específicamente, texto.
Actualmente cada vez que un trabajador registra una OPS, la clasifica en una categoría especifica en función del comportamiento riesgoso encontrado. Dado que esta clasificación es manual, hace el trabajo más tedioso y quita tiempo al trabajador, por lo que se propone un sistema de clasificación automática para las OPS.
Para clasificar automáticamente se entrenan tres algoritmos: Logit, Support Vector Machine y una red neuronal. Los resultados muestran un buen desempeño de Logit en la mayoría de las categorías en comparación con los otros dos enfoques, aunque la red neuronal, tiene un rendimiento muy similar.
Los modelos demuestran que es posible clasificar automáticamente los textos OPS, siempre priorizando la identificación de verdaderos positivos, con el fin de identificar de manera correcta las conductas riesgosas, sin afectar de manera significativa el desempeño final, logrando clasificar correctamente en la categoría correcta en más del 80% de los casos.