Towards fairer word embeddings: methodologies for comparing and optimizing bias mitigation algorithms
Professor Advisor
dc.contributor.advisor
Bravo Márquez, Felipe
Author
dc.contributor.author
Zambrano Burrows, María José
Associate professor
dc.contributor.other
Hogan, Aidan
Associate professor
dc.contributor.other
Abeliuk Kimelman, Andrés
Associate professor
dc.contributor.other
Petrache, Mircea
Admission date
dc.date.accessioned
2025-04-17T16:11:21Z
Available date
dc.date.available
2025-04-17T16:11:21Z
Publication date
dc.date.issued
2024
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/204380
Abstract
dc.description.abstract
Los modelos de word embeddings son conocidos por capturar y reflejar los sesgos presentes en los datos sobre los cuales son entrenados, lo que ha llevado a una extensa investigación sobre métricas de medición de sesgos y algoritmos de mitigación. Estos algoritmos tienen como objetivo reducir el sesgo en los modelos de word embeddings según diversas métricas de medición de sesgo. A pesar del interés en desarrollar modelos más justos, existe una comparación sistemática de estos algoritmos, lo que impide determinar cuál es el que mejor mitiga el sesgo.
El objetivo de esta tesis es realizar una comparación justa de los algoritmos de mitigación de sesgos. Se identifican tres factores de confusión clave que dificultan las comparaciones precisas: (1) uso de diferentes conjuntos de palabras al aplicar los algoritmos, (2) la interferencia entre las palabras de entrenamiento utilizadas por los métodos de mitigación y las palabras de evaluación utilizadas por las métricas, y (3) las inconsistencias en las transformaciones de normalización entre algoritmos. Además de estos factores, se destacan dos fuentes adicionales de variabilidad: (1) la selección de palabras utilizadas para entrenar y evaluar los modelos de mitigación de sesgo, y (2) los hiperparámetros de los modelos de mitigación de sesgo.
El objetivo de esta tesis es lograr una comparación equitativa de los algoritmos de mitigación de sesgos abordando estas cuestiones. Para ello, se proponen dos líneas de investigación que abordan conjuntamente este objetivo. En primer lugar, se introduce una metodología sencilla para comparar algoritmos de mitigación de sesgos que resuelve los tres factores de confusión. En segundo lugar, se presenta un esquema robusto que aborda las dos fuentes adicionales de variabilidad incorporando técnicas de algoritmos de aprendizaje automático supervisado, como la optimización de hiperparámetros y la validación cruzada.
Los resultados de los experimentos revelan que, al compararlos en un entorno controlado, las diferencias en el rendimiento de los algoritmos disminuyen, observándose resultados más similares entre ellos. Además, se observa que ninguno de los algoritmos supera significativamente al algoritmo original Hard Debias, lo que refuerza un problema común en la investigación científica: se afirma que los métodos son significativamente mejores que otros, pero en condiciones controladas, estas diferencias son menos pronunciadas.
es_ES
Patrocinador
dc.description.sponsorship
Este trabajo ha sido parcialmente financiado por ANID Subdirecci´on de Capital
Humano/Mag´ıster Nacional/2023 - 22230745 y Fondo de apoyo a la Investigaci´on,
Desarrollo e Innovaci´on con perspectiva de g´enero en STEM de la Direcci´on de Diversidad y
G´enero de la Facultad de Ciencias F´ısicas y Matem´aticas de la Universidad de Chile
es_ES
Lenguage
dc.language.iso
en
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States