Evaluación de autoatención no local en métodos anchor-free para la detección de objetos en imágenes
Tesis
Access note
Acceso abierto
Publication date
2021Metadata
Show full item record
Cómo citar
Saavedra Rondo, José Manuel
Cómo citar
Evaluación de autoatención no local en métodos anchor-free para la detección de objetos en imágenes
Author
Professor Advisor
Abstract
La detección de objetos es un área de gran interés dentro de las tareas de visión por computadora, donde hoy en día se van proponiendo distintas arquitecturas de redes neuronales que intentan resolver el problema de distintas maneras. El estado del arte esta asociado con modelos basados en redes neuronales convolucionales profundas, que utilizan distintos filtros para extraer características de una imagen.
Los métodos para detección actuales se pueden clasificar de diversas maneras. Una de estas clasificaciones se basa en facilitar la regresión respecto a los bboxes, aquí se diferencian dos tipos de métodos: los anchor-free y anchor-based. Un anchor corresponde a un rectángulo base con el que se infiere la ocurrencia de un objeto, por lo que las redes anchor-based se centran en revisar esas regiones para realizar la detección. Si bien hoy en día las redes anchor-based tienen los mejores resultados, cuando se piensa en como se realiza la búsqueda utilizando anchors resulta contra-intuitivo, debido a que para poder identificar un objeto, una persona no se centra en regiones de su visión, sino que ocupa la mayor parte de la información que tiene disponible. Aquí entran las redes anchor-free, donde al no utilizar anchors se tienen que buscar otras maneras de encontrar las regiones de interés para la detección. Para este fin, utilizar técnicas de autoatención resulta relevante. Por lo tanto, en este trabajo se presenta una evaluación de dos métodos del estado del arte donde se agregan módulos de autoatención no local.
Para realizar la evaluación del impacto de agregar el módulo que utiliza NonLocal features se realizan experimentos con dos redes anchor-free: CornerNet y FCOS, además de proponer una arquitectura que es una mezcla entre ambas redes. Los experimentos propuestos consisten en evaluar el desempeño de la red antes y después de agregar el módulo de NonLocal features.
En este trabajo se puede ver que el utilizar NonLocal features resultó efectivo para el caso de dataset de ropa, donde incluso se logró superar métodos basados en anchors. Sin embargo en el caso de otros datasets se tuvieron resultados variables, donde se concluye que falta realizar más investigación.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/184092
Collections
The following license files are associated with this item: