Nuevo método de detección de peatones de dos etapas utilizando una cabeza de clasificación con técnicas de generalización de dominio
Professor Advisor
dc.contributor.advisor
Pérez Flores, Claudio
Author
dc.contributor.author
Schulz Melgarejo, Daniel Alejandro
Associate professor
dc.contributor.other
Guevara Alvez, Pamela
Associate professor
dc.contributor.other
Delpiano Costábal, José
Associate professor
dc.contributor.other
Azurdia Meza, César
Admission date
dc.date.accessioned
2024-11-29T15:11:52Z
Available date
dc.date.available
2024-11-29T15:11:52Z
Publication date
dc.date.issued
2024
Identifier
dc.identifier.other
10.58011/qgtm-hd30
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/202083
Abstract
dc.description.abstract
La detección de peatones es una tarea importante en visión computacional, debido a muchas aplicaciones prácticas que requieren alto desempeño. Los métodos basados en Deep Learning han sido muy efectivos en esta tarea en los últimos años. Este trabajo presenta un nuevo detector de peatones de dos etapas basado en redes neuronales, que usa una nueva cabeza de clasificación, agregando la función Triplet Loss a las funciones de regresión de bounding boxes y clasificación estándar, para mejorar la capacidad de generalización de un detector de objetos existente. La función Triplet Loss se aplica a las características correspondientes a las regiones de interés generadas por la red de propuestas de región, de manera de agrupar los ejemplos de peatones en el espacio de características. Se realizaron expermentos con dos detectores, Faster R-CNN y Cascade R-CNN, utilizando el backbone HRNet preentrenado con ImageNet. Los mejores resultados se obtuvieron utilizando un pipeline de entrenamiento progresivo. El método desarrollado obtuvo resultados en el estado del arte, en el benchmark CityPersons, con un rendimiento destacado en la partición Heavy, la más difícil. Este trabajo demuestra la eficacia de la función Triplet Loss para mejorar la capacidad de generalización de los detectores de peatones existentes.
es_ES
Patrocinador
dc.description.sponsorship
Este trabajo ha sido parcialmente financiado por ANID a través del proyecto
FONDECYT 1231675, y de los proyectos basales AFB220002 e IMPACT #FB210024,
y por el Departamento de Ingeniería Eléctrica de la Universidad de Chile.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States