Evaluación de autoatención no local en métodos anchor-free para la detección de objetos en imágenes
Professor Advisor
dc.contributor.advisor
Saavedra Rondo, José Manuel
Author
dc.contributor.author
Pavez Bahamondes, Lukas Darío
Associate professor
dc.contributor.other
Gutiérrez Gallardo, Claudio
Associate professor
dc.contributor.other
Benguria Donoso, José Andrés
Admission date
dc.date.accessioned
2022-03-08T14:12:56Z
Available date
dc.date.available
2022-03-08T14:12:56Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/184092
Abstract
dc.description.abstract
La detección de objetos es un área de gran interés dentro de las tareas de visión por computadora, donde hoy en día se van proponiendo distintas arquitecturas de redes neuronales que intentan resolver el problema de distintas maneras. El estado del arte esta asociado con modelos basados en redes neuronales convolucionales profundas, que utilizan distintos filtros para extraer características de una imagen.
Los métodos para detección actuales se pueden clasificar de diversas maneras. Una de estas clasificaciones se basa en facilitar la regresión respecto a los bboxes, aquí se diferencian dos tipos de métodos: los anchor-free y anchor-based. Un anchor corresponde a un rectángulo base con el que se infiere la ocurrencia de un objeto, por lo que las redes anchor-based se centran en revisar esas regiones para realizar la detección. Si bien hoy en día las redes anchor-based tienen los mejores resultados, cuando se piensa en como se realiza la búsqueda utilizando anchors resulta contra-intuitivo, debido a que para poder identificar un objeto, una persona no se centra en regiones de su visión, sino que ocupa la mayor parte de la información que tiene disponible. Aquí entran las redes anchor-free, donde al no utilizar anchors se tienen que buscar otras maneras de encontrar las regiones de interés para la detección. Para este fin, utilizar técnicas de autoatención resulta relevante. Por lo tanto, en este trabajo se presenta una evaluación de dos métodos del estado del arte donde se agregan módulos de autoatención no local.
Para realizar la evaluación del impacto de agregar el módulo que utiliza NonLocal features se realizan experimentos con dos redes anchor-free: CornerNet y FCOS, además de proponer una arquitectura que es una mezcla entre ambas redes. Los experimentos propuestos consisten en evaluar el desempeño de la red antes y después de agregar el módulo de NonLocal features.
En este trabajo se puede ver que el utilizar NonLocal features resultó efectivo para el caso de dataset de ropa, donde incluso se logró superar métodos basados en anchors. Sin embargo en el caso de otros datasets se tuvieron resultados variables, donde se concluye que falta realizar más investigación.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States