Wefe: the word embeddings fairness evaluation framework

Badilla Torrealba, Pablo Fernando

Professor Advisor	dc.contributor.advisor	Bravo Márquez, Felipe
Professor Advisor	dc.contributor.advisor	Pérez Rojas, Jorge
Author	dc.contributor.author	Badilla Torrealba, Pablo Fernando
Associate professor	dc.contributor.other	Baeza Yates, Ricardo
Associate professor	dc.contributor.other	Hogan, Aidan
Associate professor	dc.contributor.other	Scheihing García, Eliana
Admission date	dc.date.accessioned	2021-05-19T15:42:03Z
Available date	dc.date.available	2021-05-19T15:42:03Z
Publication date	dc.date.issued	2020
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/179657
General note	dc.description	Tesis para optar al grado de Magíster en Ciencias, Mención Computación	es_ES
General note	dc.description	Memoria para optar al título de Ingeniero Civil en Computación
Abstract	dc.description.abstract	En el último tiempo, diversos estudios han mostrado que los modelos de word embeddings exhiben sesgos estereotipados de género, raza y religión, entre otros criterios. Varias métricas de equidad se han propuesto para cuantificar automáticamente estos sesgos. Aunque todas las métricas tienen un objetivo similar, la relación entre ellas no es clara. Dos problemas impiden una comparación entre sus resultados: la primera es que operan con parámetros de entrada distintos, y la segunda es que sus salidas son incompatibles entre sí. Esto implica que un modelo de word embedding que muestra buenos resultados con respecto a una métrica de equidad, no necesariamente mostrará los mismos resultados con una métrica diferente. En esta tesis proponemos WEFE, the Word Embeddings Fairness Evaluation framework, un marco teórico para encapsular, evaluar y comparar métricas de equidad. Nuestro marco toma como entrada una lista de modelos de word embeddings pre-entrenados y un conjunto de pruebas de sesgo agrupadas en distintos criterios de equidad (género, raza, religión, etc ). Luego ranquea los modelos según estos criterios de sesgo y comprueba sus correlaciones entre los rankings. Junto al desarrollo del marco, efectuamos un estudio de caso que mostró que rankings producidos por las métricas de equidad existentes tienden a correlacionarse cuando se mide el sesgo de género. Sin embargo, esta correlación es considerablemente menor para otros criterios como la raza o la religión. También comparamos los rankings de equidad generados por nuestro estudio de caso con rankings de evaluación de desempeño de los modelos de word embeddings. Los resultados mostraron que no hay una correlación clara entre la equidad y el desempeño de los modelos. Finalmente presentamos la implementación de nuestro marco teórico como librería de Python, la cual fue publicada como software de código abierto.	es_ES
Patrocinador	dc.description.sponsorship	Iniciativa Científica Milenio Código ICN17_002	es_ES
Lenguage	dc.language.iso	en	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Chile	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/cl/	*
Keywords	dc.subject	Procesamiento de lenguaje natural (Ciencia de la computación)	es_ES
Keywords	dc.subject	Aprendizaje de máquina	es_ES
Keywords	dc.subject	Bias in machine learning	es_ES
Keywords	dc.subject	Word embedding	es_ES
Keywords	dc.subject	NLP	es_ES
Título	dc.title	Wefe: the word embeddings fairness evaluation framework	es_ES
Document type	dc.type	Tesis
Cataloguer	uchile.catalogador	gmm	es_ES
Department	uchile.departamento	Departamento de Ciencias de la Computación	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.titulacion	uchile.titulacion	Doble Titulación	es_ES

Files in this item

Name:: Wefe-the-word-embeddings-fairn ...
Size:: 1.719Mb
Format:: PDF

Name:: TablaConten.pdf
Size:: 80.98Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Postgrado
Tesis Postgrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile