Show simple item record

Professor Advisordc.contributor.advisorTobar Henríquez, Felipe
Authordc.contributor.authorSalomó López, Gianina Alessandra
Associate professordc.contributor.otherRadovic Sendra, Darinka
Associate professordc.contributor.otherBravo Márquez, Felipe
Admission datedc.date.accessioned2024-08-14T15:49:51Z
Available datedc.date.available2024-08-14T15:49:51Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/200245
Abstractdc.description.abstractLos modelos de aprendizaje automático para tareas de procesamiento del lenguaje natural (NLP) suelen entrenarse con texto que puede presentar sesgo en cuanto al género, produciendo que dichos modelos puedan generar también resultados considerando dicho sesgo. Para afrontar parte de este problema, se propone una metodología para mitigar el sesgo de género en textos en español de comunicaciones escritas dentro de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile (FCFM) mediante transferencia de estilo de texto (TST), utilizando datos paralelos y un modelo de lenguaje pre entrenado (PLM) ajustado sobre dichos datos. El modelo ajustado es capaz de generar salidas con mitigación de sesgo de género, a partir de entradas que pueden o no tener sesgo de género. Se explora el ajuste de dos PLMs, Modelo de Lenguaje Causal (CausalLM) y Modelo de Lenguaje de Secuencia a Secuencia (Seq2SeqLM), utilizando un ajuste fino eficiente en parámetros (PEFT) con Adaptación de Bajo Rango (LoRA) en forma cuantizada (QLoRA). Los resultados obtenidos son prometedores, logrando una mitigación del sesgo de género frente a diversas entradas, lo cual es evaluado comparando el puntaje BLEU obtenido entre entradas sesgadas y sus salidas esperadas insesgadas, y el puntaje BLEU obtenido entre las salidas esperadas y las generadas por el modelo ajustado. Además, se entrega como contribución una Interfaz de Programación de Aplicaciones (API) con una demostración que muestra sugerencias de mitigación de sesgo en tiempo real, ofreciendo una herramienta práctica para abordar el sesgo de género en diversos contextos.es_ES
Patrocinadordc.description.sponsorshipGoogle y FONDECYT Regular 1210606es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleImplementación de modelos de lenguaje pre entrenados para la mitigación del sesgo de género en comunicaciones escritases_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoEscuela de Postgrado y Educación Continuaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencia de Datoses_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States