Towards fairer word embeddings: methodologies for comparing and optimizing bias mitigation algorithms

Zambrano Burrows, María José

Professor Advisor	dc.contributor.advisor	Bravo Márquez, Felipe
Author	dc.contributor.author	Zambrano Burrows, María José
Associate professor	dc.contributor.other	Hogan, Aidan
Associate professor	dc.contributor.other	Abeliuk Kimelman, Andrés
Associate professor	dc.contributor.other	Petrache, Mircea
Admission date	dc.date.accessioned	2025-04-17T16:11:21Z
Available date	dc.date.available	2025-04-17T16:11:21Z
Publication date	dc.date.issued	2024
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/204380
Abstract	dc.description.abstract	Los modelos de word embeddings son conocidos por capturar y reflejar los sesgos presentes en los datos sobre los cuales son entrenados, lo que ha llevado a una extensa investigación sobre métricas de medición de sesgos y algoritmos de mitigación. Estos algoritmos tienen como objetivo reducir el sesgo en los modelos de word embeddings según diversas métricas de medición de sesgo. A pesar del interés en desarrollar modelos más justos, existe una comparación sistemática de estos algoritmos, lo que impide determinar cuál es el que mejor mitiga el sesgo. El objetivo de esta tesis es realizar una comparación justa de los algoritmos de mitigación de sesgos. Se identifican tres factores de confusión clave que dificultan las comparaciones precisas: (1) uso de diferentes conjuntos de palabras al aplicar los algoritmos, (2) la interferencia entre las palabras de entrenamiento utilizadas por los métodos de mitigación y las palabras de evaluación utilizadas por las métricas, y (3) las inconsistencias en las transformaciones de normalización entre algoritmos. Además de estos factores, se destacan dos fuentes adicionales de variabilidad: (1) la selección de palabras utilizadas para entrenar y evaluar los modelos de mitigación de sesgo, y (2) los hiperparámetros de los modelos de mitigación de sesgo. El objetivo de esta tesis es lograr una comparación equitativa de los algoritmos de mitigación de sesgos abordando estas cuestiones. Para ello, se proponen dos líneas de investigación que abordan conjuntamente este objetivo. En primer lugar, se introduce una metodología sencilla para comparar algoritmos de mitigación de sesgos que resuelve los tres factores de confusión. En segundo lugar, se presenta un esquema robusto que aborda las dos fuentes adicionales de variabilidad incorporando técnicas de algoritmos de aprendizaje automático supervisado, como la optimización de hiperparámetros y la validación cruzada. Los resultados de los experimentos revelan que, al compararlos en un entorno controlado, las diferencias en el rendimiento de los algoritmos disminuyen, observándose resultados más similares entre ellos. Además, se observa que ninguno de los algoritmos supera significativamente al algoritmo original Hard Debias, lo que refuerza un problema común en la investigación científica: se afirma que los métodos son significativamente mejores que otros, pero en condiciones controladas, estas diferencias son menos pronunciadas.	es_ES
Patrocinador	dc.description.sponsorship	Este trabajo ha sido parcialmente financiado por ANID Subdirecci´on de Capital Humano/Mag´ıster Nacional/2023 - 22230745 y Fondo de apoyo a la Investigaci´on, Desarrollo e Innovaci´on con perspectiva de g´enero en STEM de la Direcci´on de Diversidad y G´enero de la Facultad de Ciencias F´ısicas y Matem´aticas de la Universidad de Chile	es_ES
Lenguage	dc.language.iso	en	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
Título	dc.title	Towards fairer word embeddings: methodologies for comparing and optimizing bias mitigation algorithms	es_ES
Document type	dc.type	Tesis	es_ES
dc.description.version	dc.description.version	Versión original del autor	es_ES
dcterms.accessRights	dcterms.accessRights	Acceso abierto	es_ES
Cataloguer	uchile.catalogador	chb	es_ES
Department	uchile.departamento	Departamento de Ciencias de la Computación	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.carrera	uchile.carrera	Ingeniería Civil en Computación	es_ES
uchile.gradoacademico	uchile.gradoacademico	Magister	es_ES
uchile.notadetesis	uchile.notadetesis	Tesis para optar al grado de Magíster en Ciencias, Mención Computación	es_ES

Files in this item

Name:: Towards-Fairer-Word-Embeddings ...
Size:: 613.4Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Postgrado
Tesis Postgrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States