Evaluación de metodologías de imputación de datos en motores diésel para el desarrollo de sistemas de diagnóstico inteligente de fallas
Tesis
![Thumbnail](/themes/Mirage2/images/cubierta.jpg)
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Meruane Naranjo, Viviana
Cómo citar
Evaluación de metodologías de imputación de datos en motores diésel para el desarrollo de sistemas de diagnóstico inteligente de fallas
Author
Professor Advisor
Abstract
El diagnóstico inteligente de fallas en los equipos se puede realizar a partir de la identificación de patrones anómalos, mediante algoritmos de detección de anomalías o novedades, debido a que una anomalía puede ser un precursor de una falla en el equipo.
El proceso previo de análisis de los datos es fundamental para realizar un diagnóstico acabado y certero, en la actualidad, aquel proceso debe enfrentar el desafío de los datos faltantes o los mejores conocidos como "NaNs". Esta pérdida de información usualmente lleva a eliminar toda la observación cuando no se posee algún dato, siendo una motivación adentrarse en metodologías de manejo datos faltantes. La imputación de datos es una solución frente al desafío mencionado, ya que es un procedimiento de reemplazo de valores faltantes por un conjunto de datos. Existen métodos estadísticos para efectuar el reemplazo, entre ellos está la imputación media o la imputación con FillFoward y también existen procedimientos de imputación a través de modelos basados en aprendizaje de máquinas. Algunos ejemplos de estos modelos son la imputación múltiple en cadena, que es un algoritmo iterativo de regresión; la metodología de imputación con K-Nearest Neighbor, la cual es un método de clasificación supervisado basándose en distancia; u otro ejemplo es realizar el procedimiento de imputación de datos con árboles de regresión ya sea uno o implementando varios a la vez en los algoritmos Decision Tree, Random Forest o Extremelly Randomized Tree.
El objetivo general del Trabajo de Título es comparar metodologías de imputación de datos faltantes en una base de datos de dos motores diésel marinos y evaluar el impacto del proceso de imputación en el diagnóstico inteligente de fallas. Para esto se consideran los siguientes objetivos específicos: (i) analizar la base de datos disponible y efectuar un preprocesamiento de los datos (ii) comparar y seleccionar la metodología de imputación de datos faltantes que se ajuste de mejor manera a la base de datos, (iii) evaluar el impacto del proceso de imputación de datos faltantes en el diagnóstico inteligente de fallas.
A partir de los resultados se concluye que el modelo de imputación de datos faltantes con mejor resultado es K-Nearest Neighbor con el algoritmo de pesos uniformes, debido a que la metodología imputa valores con propiedades físicas dentro del rango permitido u observado, considerando la evolución de las mediciones. Por otro lado, tras comparar los procedimientos con imputación de datos faltantes y sin imputación de datos faltantes, se evidencia que la imputación de datos es una herramienta poderosa que permite estudiar todos los sistemas de los motores, sin embargo, debe ser estudiada en profundidad, ya que escoger una metodología errónea puede sesgar el análisis y conclusiones del estudio.
El informe consta de cinco capítulos: (i) Introducción, (ii) Antecedentes, (iii) Metodología, (iv) Resultados y Análisis, y (v) Conclusiones.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al título de Ingeniera Civil Mecánica
Collections
The following license files are associated with this item: