Show simple item record

Professor Advisordc.contributor.advisorBravo Márquez, Felipe
Professor Advisordc.contributor.advisorPérez Rojas, Jorge
Authordc.contributor.authorBadilla Torrealba, Pablo Fernando 
Associate professordc.contributor.otherBaeza Yates, Ricardo
Associate professordc.contributor.otherHogan, Aidan
Associate professordc.contributor.otherScheihing García, Eliana
Admission datedc.date.accessioned2021-05-19T15:42:03Z
Available datedc.date.available2021-05-19T15:42:03Z
Publication datedc.date.issued2020
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/179657
General notedc.descriptionTesis para optar al grado de Magíster en Ciencias, Mención Computaciónes_ES
General notedc.descriptionMemoria para optar al título de Ingeniero Civil en Computación
Abstractdc.description.abstractEn el último tiempo, diversos estudios han mostrado que los modelos de word embeddings exhiben sesgos estereotipados de género, raza y religión, entre otros criterios. Varias métricas de equidad se han propuesto para cuantificar automáticamente estos sesgos. Aunque todas las métricas tienen un objetivo similar, la relación entre ellas no es clara. Dos problemas impiden una comparación entre sus resultados: la primera es que operan con parámetros de entrada distintos, y la segunda es que sus salidas son incompatibles entre sí. Esto implica que un modelo de word embedding que muestra buenos resultados con respecto a una métrica de equidad, no necesariamente mostrará los mismos resultados con una métrica diferente. En esta tesis proponemos WEFE, the Word Embeddings Fairness Evaluation framework, un marco teórico para encapsular, evaluar y comparar métricas de equidad. Nuestro marco toma como entrada una lista de modelos de word embeddings pre-entrenados y un conjunto de pruebas de sesgo agrupadas en distintos criterios de equidad (género, raza, religión, etc ). Luego ranquea los modelos según estos criterios de sesgo y comprueba sus correlaciones entre los rankings. Junto al desarrollo del marco, efectuamos un estudio de caso que mostró que rankings producidos por las métricas de equidad existentes tienden a correlacionarse cuando se mide el sesgo de género. Sin embargo, esta correlación es considerablemente menor para otros criterios como la raza o la religión. También comparamos los rankings de equidad generados por nuestro estudio de caso con rankings de evaluación de desempeño de los modelos de word embeddings. Los resultados mostraron que no hay una correlación clara entre la equidad y el desempeño de los modelos. Finalmente presentamos la implementación de nuestro marco teórico como librería de Python, la cual fue publicada como software de código abierto.es_ES
Patrocinadordc.description.sponsorshipIniciativa Científica Milenio Código ICN17_002es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 Chile*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/*
Keywordsdc.subjectProcesamiento de lenguaje natural (Ciencia de la computación)es_ES
Keywordsdc.subjectAprendizaje de máquinaes_ES
Keywordsdc.subjectBias in machine learninges_ES
Keywordsdc.subjectWord embeddinges_ES
Keywordsdc.subjectNLPes_ES
Títulodc.titleWefe: the word embeddings fairness evaluation frameworkes_ES
Document typedc.typeTesis
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Chile
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile