Show simple item record

Professor Advisordc.contributor.advisorEstévez Valencia, Pablo
Authordc.contributor.authorCaragol Díaz, Vicente Nolasco
Associate professordc.contributor.otherReyes Jainaga, Ignacio
Associate professordc.contributor.otherForster Burón, Francisco
Admission datedc.date.accessioned2024-04-22T19:41:37Z
Available datedc.date.available2024-04-22T19:41:37Z
Publication datedc.date.issued2023
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/198127
Abstractdc.description.abstractEn estudios astronómicos se procesan altos volúmenes de datos de gran tamaño, por lo que para el procesamiento de éstos se utilizan algoritmos de aprendizaje de máquinas. Sin embargo, para el problema de clasificación de eventos astronómicos se presenta la problemática del desbalance en el número de datos que se tiene de cada tipo de evento, lo que puede provocar que algoritmos de clasificación presenten un sesgo en su desempeño. Por esto, en el presente trabajo se estudiaron distintas metodologías de balance de datos en conjunto a un clasificador XGBoost para afrontar esta problemática y disminuir el sesgo hacia los eventos más comunes al clasificar sus curvas de luz. Se analizó una relación entre dicho sesgo con la variación del parámetro de profundidad máxima del clasificador, observándose un menor sesgo cuando se disminuye dicho parámetro. Se estudió también la modificación de un algoritmo Gradient Boosting al implementar balance de datos en la construcción de sus árboles mediante bootstrapping, con lo que se pudo observar una mejor clasificación en las clases menos representadas. También se utilizaron datos de clase transiente generados sintéticamente para estudiar el desempeño de XGBoost con un conjunto de datos balanceados mediante esta metodología, lo que permitió una mejor clasificación de datos transientes en comparación a las otras metodologías utilizadas junto a XGBoost. Finalmente, los resultados obtenidos son comparados con los obtenidos con Balanced Random Forest, algoritmo utilizado por el clasificador de curvas de luz del broker ALeRCE.es_ES
Patrocinadordc.description.sponsorshipANID, Iniciativa Científica Milenio, ICN12_009 y Fondecyt 1220829es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleOptimización de técnicas de balance de datos para clasificador de curvas de luz basado en XGBoostes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Eléctricaes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Eléctricoes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States