Evaluación de metodologías de imputación de datos en motores diésel para el desarrollo de sistemas de diagnóstico inteligente de fallas
Professor Advisor
dc.contributor.advisor
Meruane Naranjo, Viviana
Author
dc.contributor.author
Reyes Osorio, Tatiana Isidora
Associate professor
dc.contributor.other
López Droguett, Enrique
Associate professor
dc.contributor.other
Marín Castillo, Jorge
Admission date
dc.date.accessioned
2023-05-24T20:54:59Z
Available date
dc.date.available
2023-05-24T20:54:59Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.other
10.58011/ryvp-3t43
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/193770
Abstract
dc.description.abstract
El diagnóstico inteligente de fallas en los equipos se puede realizar a partir de la identificación de patrones anómalos, mediante algoritmos de detección de anomalías o novedades, debido a que una anomalía puede ser un precursor de una falla en el equipo.
El proceso previo de análisis de los datos es fundamental para realizar un diagnóstico acabado y certero, en la actualidad, aquel proceso debe enfrentar el desafío de los datos faltantes o los mejores conocidos como "NaNs". Esta pérdida de información usualmente lleva a eliminar toda la observación cuando no se posee algún dato, siendo una motivación adentrarse en metodologías de manejo datos faltantes. La imputación de datos es una solución frente al desafío mencionado, ya que es un procedimiento de reemplazo de valores faltantes por un conjunto de datos. Existen métodos estadísticos para efectuar el reemplazo, entre ellos está la imputación media o la imputación con FillFoward y también existen procedimientos de imputación a través de modelos basados en aprendizaje de máquinas. Algunos ejemplos de estos modelos son la imputación múltiple en cadena, que es un algoritmo iterativo de regresión; la metodología de imputación con K-Nearest Neighbor, la cual es un método de clasificación supervisado basándose en distancia; u otro ejemplo es realizar el procedimiento de imputación de datos con árboles de regresión ya sea uno o implementando varios a la vez en los algoritmos Decision Tree, Random Forest o Extremelly Randomized Tree.
El objetivo general del Trabajo de Título es comparar metodologías de imputación de datos faltantes en una base de datos de dos motores diésel marinos y evaluar el impacto del proceso de imputación en el diagnóstico inteligente de fallas. Para esto se consideran los siguientes objetivos específicos: (i) analizar la base de datos disponible y efectuar un preprocesamiento de los datos (ii) comparar y seleccionar la metodología de imputación de datos faltantes que se ajuste de mejor manera a la base de datos, (iii) evaluar el impacto del proceso de imputación de datos faltantes en el diagnóstico inteligente de fallas.
A partir de los resultados se concluye que el modelo de imputación de datos faltantes con mejor resultado es K-Nearest Neighbor con el algoritmo de pesos uniformes, debido a que la metodología imputa valores con propiedades físicas dentro del rango permitido u observado, considerando la evolución de las mediciones. Por otro lado, tras comparar los procedimientos con imputación de datos faltantes y sin imputación de datos faltantes, se evidencia que la imputación de datos es una herramienta poderosa que permite estudiar todos los sistemas de los motores, sin embargo, debe ser estudiada en profundidad, ya que escoger una metodología errónea puede sesgar el análisis y conclusiones del estudio.
El informe consta de cinco capítulos: (i) Introducción, (ii) Antecedentes, (iii) Metodología, (iv) Resultados y Análisis, y (v) Conclusiones.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States