Identificación de estilos artísticos a través de redes convolucionales y análisis de arquetipos
Tesis
Access note
Acceso abierto
Publication date
2021Metadata
Show full item record
Cómo citar
Sipiran Mendoza, Iván Anselmo
Cómo citar
Identificación de estilos artísticos a través de redes convolucionales y análisis de arquetipos
Author
Professor Advisor
Abstract
La motivación de este trabajo surge de la posibilidad de encontrar un método de categorización de obras artísticas según su estilo artístico. Esto se debe a que, además de los fines prácticos que esto puede tener, tales como el etiquetamiento de obras artistas y el armado de sistemas de recomendaciones de arte, este problema presenta una técnica alternativa para la categorización de entes más abstractos como lo son los estilos artísticos.
El problema a resolver se basa en la implementación de un algoritmo de clasificación de estilos artísticos para obras de arte a través de la combinación de redes neuronales convolucionales con el análisis de arquetipos, algoritmo que luego se modifica en base la precisión obtenida durante diversos experimentos para alcanzar un desempeño superior, seguido de un análisis final de los resultados obtenidos.
La solución implementada consiste en diversos pasos. Se requiere entrenar una red neuronal con una base de datos con la información pertinente al problema, siendo esto una etiqueta de estilo artístico para cada imagen. Una vez entrenada esta red, se usan sus capas para extraer características de las imágenes de una base de entrenamiento, convirtiendo así estas imágenes en vectores de características. Estos vectores de características se agrupan según estilo artístico, donde luego se usa el análisis de arquetipos para obtener un número arbitrario de arquetipos asociados a cada estilo artístico. Finalmente, se itera sobre las imágenes de un conjunto de evaluación, en donde cada imagen es aproximada como una combinación convexa de los arquetipos de cada estilo, siendo la combinación de arquetipos de un mismo estilo con una mayor cercanía a la imagen original aquella que determina el estilo de la imagen a categorizar. De esta forma, se puede evaluar la cantidad de imágenes que fueron categorizadas de forma correcta para contar con la precisión final de la estrategia planteada.
Los resultados más relevantes consisten en la mejora de una configuración inicial con una precisión de un 32% en una configuración final con una precisión de un 50%, mientras que la red neuronal usada para calcular los arquetipos de esta configuración final alcanza una precisión de un 57%. Este resultado se logra gracias a dos pasos particularmente importantes. El primer paso es la utilización de una capa específica de la red neuronal para la caracterización de las imágenes, a diferencia de la sugerencia hecha por trabajos anteriores que utilizan múltiples capas a lo largo de toda la red neuronal, lo que se traduce en una mejora de un 34% a un 42% de precisión. El segundo paso es el aumento de arquetipos de forma artificial, debido a que restricciones de memoria no permiten un uso mayor a una cantidad fija de arquetipos previo a este aumento artificial, lo que permite subir la precisión de un 42% a un 50%.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/184030
Collections
The following license files are associated with this item: