Show simple item record

Professor Advisordc.contributor.advisorBaloian Tataryan, Nelson
Authordc.contributor.authorValdivia Orellana, Ricardo Mauricio
Associate professordc.contributor.otherBravo Márquez, Felipe
Associate professordc.contributor.otherMaldonado Flores, Jazmine
Admission datedc.date.accessioned2024-10-09T19:10:29Z
Available datedc.date.available2024-10-09T19:10:29Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/201445
Abstractdc.description.abstractEl clustering es un método de aprendizaje no supervisado cuyo objetivo es identificar conjuntos de datos con características similares. La calidad de un modelo de clustering se mide a menudo por su validez en lugar de su precisión, utilizando indicadores como el Índice de Rand y el Coeficiente de Correlación. En los últimos años, ha surgido un interés creciente en crear modelos de clustering no solo válidos, sino también interpretables. La interpretabilidad se refiere a la capacidad del modelo para permitir que un usuario humano comprenda cómo y por qué el modelo llega a un resultado específico. Los algoritmos de clustering actuales, como el K-means, son populares por su simplicidad y escalabilidad, pero a menudo son considerados como ``cajas negras'' debido a la falta de transparencia en sus resultados. Esto ha llevado a un enfoque creciente en la interpretación de los modelos de clustering y en el desarrollo de técnicas de explicación de modelos, como SHAP (SHapley Additive exPlanations), para proporcionar una interpretación clara de cómo se generan los resultados del clustering. La solución propuesta en este proyecto es el desarrollo de un algoritmo de clustering que genera etiquetas para los datos y, utilizando el clasificador DS (Dempster-Shafer), produce reglas claras que aseguran la interpretabilidad para los usuarios. El desarrollo se realiza en dos etapas: la selección de etiquetas óptimas para el entrenamiento y la consolidación del algoritmo de clustering, incluyendo el entrenamiento y la predicción del clasificador DS para cada punto de datos. El algoritmo DSClustering implementado logra una combinación efectiva de técnicas de clustering con interpretación mejorada a través de la generación automática de reglas categóricas y ajustes precisos en el proceso de entrenamiento del clasificador. El algoritmo se destaca por su capacidad para ofrecer resultados de clustering fiables y comprensibles, lo que mejora la transparencia y la confianza en la toma de decisiones basada en los datos. Esta combinación de validez y transparencia en los resultados de clustering representa un avance significativo en el campo del aprendizaje automático.es_ES
Abstractdc.description.abstractClustering is an unsupervised learning method aimed at identifying data sets with similar characteristics. The quality of a clustering model is often assessed by its validity rather than its accuracy, using measures such as the Rand Index and the Correlation Coefficient. Recently, there has been an increasing interest in creating not only valid but also interpretable clustering models. Interpretability refers to the model’s ability to enable a human user to understand the how and why behind the model’s specific outcomes. Current clustering algorithms, like K-means, are favored for their simplicity and scalability, yet they are often viewed as“black boxe” due to their opaque results. This has led to a growing focus on understanding and interpreting clustering models, and in developing model explanation techniques, such as SHAP (SHapley Additive exPlanations), to provide a clear understanding of how clustering results are produced. The proposed solution in this project involves the development of a clustering algorithm that generates labels for data and, using the DS (Dempster-Shafer) classifier, creates clear rules ensuring interpretability for users. The development occurs in two stages: selecting optimal labels for training and consolidating the clustering algorithm, including training and predicting with the DS classifier for each data point. The implemented DSClustering algorithm achieves an effective combination of clustering techniques with enhanced interpretation through the automatic generation of categorical rules and precise adjustments in the training process of the classifier. The algorithm stands out for its ability to provide reliable and comprehensible clustering results, enhancing transparency and trust in data-driven decision-making. This blend of validity and transparency in clustering outcomes marks a significant advancement in the field of machine learning.es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleAlgorithm for interpretable clustering using Dempster-Shafer theoryes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil en Computaciónes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States