Show simple item record

Professor Advisordc.contributor.advisorHitschfeld Kahler, Nancy
Professor Advisordc.contributor.advisorCerda Villablanca, Mauricio
Authordc.contributor.authorKindelan Nuñez, Rolando
Associate professordc.contributor.otherSipirán Mendoza, Iván
Associate professordc.contributor.otherBarbay, Jérémy
Associate professordc.contributor.otherAdams, Henry
Admission datedc.date.accessioned2026-03-12T19:18:59Z
Available datedc.date.available2026-03-12T19:18:59Z
Publication datedc.date.issued2025
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/208969
Abstractdc.description.abstractEsta investigación se enfoca en la intersección entre el Análisis Topológico de Datos (TDA), el Aprendizaje Automático/Profundo (ML/DL) y las Estructuras de Datos Compactas, proponiendo que el TDA puede abordar de manera independiente desafíos de clasificación al revelar relaciones multiescala que el ML/DL suele pasar por alto. A lo largo de esta investigación, enfrentamos desafíos computacionales y topológicos. La principal dificultad computacional fue manejar la naturaleza combinatoria y la escalabilidad de los complejos simpliciales, un reto persistente en TDA, especialmente al mantenerlos explícitamente en memoria. Para abordarlo, proponemos algoritmos con distancias generalizadas y desarrollamos una representación compacta basada en símplices maximales para complejos generales y filtrados, reduciendo el uso de memoria entre 13 y 275 veces (comparado con SimplexTree, la estructura de datos de vanguardia en TDA) en conjuntos de datos de alta dimensión como Coauthorship, manteniendo precisión y eficiencia. A diferencia de los enfoques tradicionales que enriquecen el ML/DL con diagramas de persistencia, nuestro método utiliza homología persistente para seleccionar subcomplejos de una filtración con vecindades simpliciales, extendiendo los grafos de vecinos cercanos para capturar relaciones de alto orden (triángulos en lugar de aristas), abordando un desafío topológico clave. Guiados por un análisis heurístico de la duración de intervalos de persistencia, estos subcomplejos preservan clústeres y huecos que los grafos kNN suelen pasar por alto, permitiendo una clasificación basada únicamente en TDA. Proponemos medidas topológicas para evaluar la relevancia de los símplices e introducimos métodos para la imputación de datos faltantes, TDA con datos parciales, corrección de ruido en etiquetas, selección de características y detección de anomalías, reemplazando los grafos kNN con Complejos Simpliciales de Vecinos Cercanos (NNSC) más expresivos. Para comparar diagramas de persistencia masivos, introducimos las Pseudodistancias Topológicas Extendidas (ETDs), que equilibran la eficiencia de las estadísticas de persistencia y la fidelidad topológica de las distancias de Wasserstein, demostrando un rendimiento competitivo en tiempo de ejecución y en los benchmarks de clasificación. Validado en Iris, Wine, Breast Cancer, Sphere y Swissroll, nuestro Clasificador Basado en TDA (TDABC) destaca especialmente con clases desbalanceadas y superpuestas, posicionando al TDA como un paradigma independiente dentro del aprendizaje automático topológico. Los esfuerzos futuros se centran en mejorar la selección de subcomplejos, aumentar la escalabilidad y realizar validaciones más amplias.es_ES
Patrocinadordc.description.sponsorshipEste trabajo ha sido parcialmente financiado por ANID/Doctorado Nacional/2018-21181978es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationales_ES
Link to Licensedc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0es_ES
Keywordsdc.subjectInvestigación cuantitativaes_ES
Keywordsdc.subjectAprendizaje de máquinaes_ES
Keywordsdc.subjectProcesamiento electrónicoes_ES
Títulodc.titleTopological data analysis for classification of noisy and high-dimensional datasetses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.gradoacademicouchile.gradoacademicoDoctoradoes_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de doctor en Computaciónes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 International
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International