Show simple item record

Professor Advisordc.contributor.advisorTobar Henríquez, Felipe
Professor Advisordc.contributor.advisorFontbona Torres, Joaquín
Authordc.contributor.authorCarvajal Reyes, Camilo Reyes
Associate professordc.contributor.otherLeglaive, Simon
Admission datedc.date.accessioned2025-03-26T13:14:10Z
Available datedc.date.available2025-03-26T13:14:10Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/203851
Abstractdc.description.abstractLos modelos basados en score (SBM por sus siglas en inglés), también conocidos como modelos de difusión, son considerados de facto como los modelos de estado del arte para generación de imágenes. Pese a su rendimiento sin precedentes los SBMs han estado bajo la lupa por ser capaces de crear contenido "not-safe-for-work" (NSFW), i.e., contenido inapropiado. Esta tesis propone un método alternativo de muestreo para SBMs que implementa un paso de Corrección Condicional de Trayectoria (CTC) para guiar las muestras a regiones de bajo riesgo de contenido NSFW en el espacio ambiente. Más aún, usando Pre-entrenamiento Contrastente Imagen-Texto (CLIP), nuestro método admite clases NSFW que permiten una gran flexibilidad según la configuración. Nuestros experimentos usando el SBM \textit{Stable Diffusion} validan que el muestreo seguro efectivamente reduce la generación de contenido explícito, lo cual fue medido con detectores independientes de imágenes NSFW. Más aún, la corrección propuesta conlleva un costo mínimo en calidad de imagen y un efecto casi nulo en muestras que no necesitan corrección. Estos resultados exhiben el potencial del muestreo seguro y métodos basados en CLIP para alinear SBMs.es_ES
Abstractdc.description.abstractScore-based generative models (SBM), also known as diffusion models, are the de facto state of the art for image synthesis. Despite their unparalleled performance, SBMs have recently been in the spotlight for being tricked into creating not-safe-for-work (NSFW) content, such as violent images and non-consensual nudity. This thesis proposes a Safe sampler for SBMs implementing a Conditional Trajectory Correction step that guides the samples away from undesired regions in the ambient space. Furthermore, using Contrastive Language Image Pre-training (CLIP, Radford et al., 2021), our method admits user-defined NSFW classes, which can vary in different settings. Our experiments on the text-to-image SBM Stable Diffusion (Rombach et al., 2022) validate that the proposed Safe sampler effectively reduces the generation of explicit violent content, as assessed via independent NSFW detectors. Furthermore, the proposed correction comes at a minor cost in image quality and has an almost null effect on samples that do not need correction. Our study confirms the suitability of the Safe sampler towards aligned SBM models.es_ES
Patrocinadordc.description.sponsorshipEste trabajo ha sido parcialmente financiado por: Fondecyt Regular No 1210606es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleSafe sampling for score based models classifier : unguidance with conditional diffusion trajectory correctiones_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoEscuela de Postgrado y Educación Continuaes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Matemática
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencias de Datoses_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Matemático


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States