Evaluación de métodos auto-supervisados y semi-supervisados para la extracción de características visuales en el contexto de recuperación de imágenes basada en dibujos

Morales Rodríguez, Javier

Professor Advisor	dc.contributor.advisor	Saavedra Rondo, José Manuel
Professor Advisor	dc.contributor.advisor	Murrugarra Llerena, Nils
Author	dc.contributor.author	Morales Rodríguez, Javier
Associate professor	dc.contributor.other	Abeliuk Kimelman, Andrés
Associate professor	dc.contributor.other	Urzúa Reinoso, José
Admission date	dc.date.accessioned	2022-03-18T15:10:12Z
Available date	dc.date.available	2022-03-18T15:10:12Z
Publication date	dc.date.issued	2021
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/184264
Abstract	dc.description.abstract	La recuperación de imágenes basada en dibujos es un problema del área de visión por computadora en donde se utilizan dibujos para realizar consultas y recuperar las fotos que más se parezcan al dibujo realizado. Debido a los avances tecnológicos de la última década, este problema ha comenzado a tener relevancia en el eCommerce, en donde se utilizan herramientas que permiten que el usuario dibuje lo que desea comprar. En este contexto, este trabajo busca evaluar métodos auto-supervisados y semi-supervisados para la extracción de características visuales, pudiendo utilizar fotos y dibujos sin etiquetas, para entrenar modelos que resuelvan el problema descrito. Se implementan y estudian varios modelos de redes convolucionales enfocados a extraer características de dibujos, teniendo dos conjuntos: los modelos basados en Variational Autoencoders (VAE) y los modelos basados en Bootstrap Your Own Latent (BYOL). El primer grupo contempla modelos generativos, que son capaces de codificar una imagen en un vector de baja dimensionalidad y luego reconstruirla. Se estudian dos variedades, un VAE simple auto-supervisado que no utiliza etiquetas, y dos versiones de modelos VAE semi-supervisados capaces de ser entrenados con datos con y sin etiquetas. El primero no logra resultados que sean capaces de competir con los modelos supervisados, logrando solo un mAP@5 de 0,310 en comparación al 0,528 obtenido por un modelo supervisado, al evaluar en un conjunto con clases distintas a las del entrenamiento. Los modelos semi-supervisados M2 y VAE semi-supervisado, logran resultados competitivos solo al evaluar con las mismas clases utilizadas en el entrenamiento, logrando un mAP@5 de 0,648 y 0,624 respectivamente, en comparación al 0,585 obtenido por la contraparte supervisada. En cuanto a los modelos basados en BYOL, se utiliza un BYOL simple para extraer características de dibujos, este modelo logra resultados competitivos contra modelos supervisados, logrando incluso generalizar de mejor manera hacia otras clases con un mAP@5 de 0,590 en comparación al 0,528 obtenido por un método supervisado. Debido a esto, se diseña un modelo inspirado en BYOL para trabajar tanto con dibujos como imágenes, pudiendo enfrentar el problema de recuperación de imágenes basada en dibujos. Este modelo logra resultados competitivos con los modelos de redes siamesas que se utilizan en la actualidad, sin utilizar etiquetas ni funciones de pérdida de clasificación durante el entrenamiento, teniendo un mAP de 0,178 al evaluar en un conjunto de datos de eCommerce, en comparación al 0,145 obtenido por una red siamesa supervisada. Finalmente, se propone una extensión de método de BYOL para fotos y dibujos, en donde solo se necesitan fotos y los dibujos son generados durante el entrenamiento, por lo que sería un modelo completamente auto-supervisado.	es_ES
Lenguage	dc.language.iso	es	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
Keywords	dc.subject	Procesamiento de imagen
Keywords	dc.subject	Sistemas de almacenamiento y recuperación de información
Keywords	dc.subject	Deep learning
Keywords	dc.subject	Sketches
Keywords	dc.subject	Sketch Based Image Retrieval
Keywords	dc.subject	Bootstrap Your Own Latent
Keywords	dc.subject	Auto-supervised training
Título	dc.title	Evaluación de métodos auto-supervisados y semi-supervisados para la extracción de características visuales en el contexto de recuperación de imágenes basada en dibujos	es_ES
Document type	dc.type	Tesis	es_ES
dc.description.version	dc.description.version	Versión original del autor	es_ES
dcterms.accessRights	dcterms.accessRights	Acceso abierto	es_ES
Cataloguer	uchile.catalogador	gmm	es_ES
Department	uchile.departamento	Departamento de Ciencias de la Computación	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.carrera	uchile.carrera	Ingeniería Civil en Computación	es_ES
uchile.gradoacademico	uchile.gradoacademico	Licenciado	es_ES
uchile.notadetesis	uchile.notadetesis	Memoria para optar al título de Ingeniero Civil en Computación	es_ES

Files in this item

Name:: Evaluacion-de-metodos-auto-sup ...
Size:: 7.334Mb
Format:: PDF

Name:: TablaConten.pdf
Size:: 141.5Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Pregrado
Tesis Pregrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States