Show simple item record

Professor Advisordc.contributor.advisorEstévez Valencia, Pablo
Authordc.contributor.authorMolina Ferreiro, Javier Antonio
Associate professordc.contributor.otherZegers Fernández, Pablo
Associate professordc.contributor.otherReyes Jainaga, Ignacio Alfredo
Admission datedc.date.accessioned2022-05-30T21:29:52Z
Available datedc.date.available2022-05-30T21:29:52Z
Publication datedc.date.issued2022
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/185788
Abstractdc.description.abstractLos telescopios de survey recolectan todas las noches grandes cantidades de datos sobre las variaciones en el brillo de objetos estelares o bien, de su movimiento, denominadas alertas astronómicas. Dado el volumen de datos y la velocidad a la que se producen, se requieren agentes intermediarios, denominados brokers, quienes realizan la clasificación de alertas. ALeRCE es un broker que recibe las alertas provenientes del survey astronómico ZTF (Zwicky Transient Facility) y entre sus principales labores está la rápida clasificación de las alertas, siendo capaz de separar las alertas falsas de las reales, y dentro de estas últimas, identificar hasta 15 clases distintas. En el presente trabajo se evaluó el potencial del algoritmo de aprendizaje XGBoost en la tarea predictiva de clasificación de curvas de luz. Actualmente ALeRCE utiliza el modelo Balanced Random Forest (BRF). La motivación detrás de este estudio es el gran desbalance de los datos, el cual es agravado debido a las múltiples clases existentes. Por este motivo se propone el estudio e implementación de técnicas para evitar el efecto de entrenar modelos con desbalance de datos. Para el entrenamiento del modelo XGBoost usando distintas técnicas de balance, se implementó el procedimiento Nested Cross Validation mediante el cual se entrena y evalúa cada modelo 10 veces con distintos grupos de entrenamiento y test, de forma de obtener valores promedio para el desempeño. Este mismo procedimiento fue realizado además para replicar el clasificador de ALeRCE con BRF, para así poder comparar el desempeño de ambos modelos. Fueron varias técnicas de desbalance con las que XGBoost mejoró sus resultados. Al analizar las matrices de confusión resultantes se comprobó una disminución en el sesgo hacia las clases mayoritarias por parte del modelo predictivo. Se destaca la técnica de balance Cost Sensitive Learning, con la cual XGBoost superó a BRF en todos clasificadores que componen el clasificador de curvas de luz, obteniendo en la unión de niveles del clasificador valores de 0.67, 0.79 y 0.70 para Precision, Recall y F1-score respectivamente, en contraste con BRF que obtuvo valores de 0.57, 0.76 y 0.60 para las mismas métricas respectivamente, demostrando además que las diferencias de desempeño obtenidas fueron estadísticamente significativas. Por último, se realizó un test final en los modelos con los que se obtuvo mejores resultados. Las curvas de luz de este test corresponden a aquellas que no fueron utilizadas ni durante la experimentación del presente trabajo ni por ALeRCE en el paper en el que presentaron su clasificador de curvas luz. De los resultados obtenidos se confirma que Cost Sensitive Learning es la mejor técnica de balance de datos para utilizar en conjunto con XGBoost.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectAstronomía
Keywordsdc.subjectAprendizaje de máquina
Keywordsdc.subjectCurvas de luz
Keywordsdc.subjectAlerta astronómica
Keywordsdc.subjectXGBoost
Títulodc.titleClasificador de curvas de luz utilizando modelo XGBoost y técnicas de balance de datoses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Eléctricaes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Eléctricoes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States