Show simple item record

Professor Advisordc.contributor.advisorTobar Henríquez, Felipe
Authordc.contributor.authorBergasa Sariego, Camila Andreas
Associate professordc.contributor.otherGoic Figueroa, Marcel
Associate professordc.contributor.otherRadovic Sendra, Darinka
Admission datedc.date.accessioned2025-03-12T14:11:21Z
Available datedc.date.available2025-03-12T14:11:21Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/203484
Abstractdc.description.abstractEl aumento en la utilización de métodos predictivos plantea la siguiente inquietud respecto de la equidad: ¿cómo garantizamos que estos métodos, entrenados con datos reales, no reproducen los sesgos sociales existentes? Cuando los conjuntos de datos empleados para el entrenamiento contienen sesgos injustos, existe el riesgo de que estos se perpetúen en los modelos predictivos. Abordar este desafío es fundamental, ya que la replicación de sesgos en sistemas automatizados puede perpetuar desigualdades y discriminar a grupos considerados vulnerables. Se busca mediante este trabajo de tesis investigar estrategias que ayuden a la mitigación de estos sesgos y promuevan la equidad en el uso de modelos predictivos. En ese contexto, el objetivo de este trabajo de tesis es aplicar un marco metodológico basado en la teoría del transporte óptimo para mejorar la equidad en al implementar algoritmos de clasificación, con un enfoque específico de mitigación de sesgos de género en conjuntos de datos de censos. La simple eliminación de las variables que pueden ser fuente de trato injusto no es suficiente, ya que el modelo puede reconstruirlas a partir de otras variables y posteriormente usarlas en las predicciones. Una forma de abordar este problema es generando una distorsión del conjunto de datos, en esta línea, el artículo "Obtaining Fairness using Optimal Transport Theory" propone una solución inspirada en la teoría del transporte óptimo para generar esta distorsión. El artículo plantea que dicha técnica elimina la capacidad del modelo de identificar y de luego usar estos sesgos sensibles, mientras busca conservar el rendimiento del modelo. A esta técnica se le llama reparación de los datos. Después de introducir el marco teórico y el estado del arte asociados al uso de teoría del transporte óptimo para imponer equidad en algoritmos de clasificación, se explica la metodología empleada para realizar la reparación de los datos con sus respectivos resultados. Primero, se repararon los datos usando el método de reparación total, el cual distorsiona todo el conjunto de datos de entrada para eliminar el sesgo asociado a las variables sensibles. Luego, se evalúan dos métodos de reparación parcial: la reparación geométrica que mediante un peso 𝜆�� modera el grado de reparación deseado para los datos y posteriormente se utiliza la reparación aleatoria, donde el peso 𝜆�� no es 𝑆�� si no que está dado por una distribución Bernoulli de parámetro 𝜆��. En paralelo, se realiza una evaluación de los modelos sin reparación de datos, para ver si efectivamente la inclusión de metodologías de reparación de los datos es una forma efectiva de eliminar el sesgo en los algoritmos de aprendizaje automático. Dentro de los principales hallazgos se muestra que los métodos de reparación parciales son más efectivos para reducir el impacto de los sesgos de género en los modelos predictivos. Además, la comparación con modelos sin reparación de datos confirmó que la implementación de estas metodologías de reparación son útiles para lograr una mayor equidad en las predicciones.es_ES
Patrocinadordc.description.sponsorshipEste trabajo ha sido parcialmente financiado por: GOOGLE Y FONDECYT - REGULAR 1210606es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleMejorando la equidad en algoritmos de aprendizaje automático usando un enfoque de transporte óptimoes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoEscuela de Postgrado y Educación Continuaes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Industrial
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencia de Datoses_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniera Civil Industrial


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States