Detector integrado de instancias de objetos en tiempo real
Professor Advisor
dc.contributor.advisor
Ruiz Del Solar San Martin, Javier
Professor Advisor
dc.contributor.advisor
Loncomilla Zambrana, Patricio
Author
dc.contributor.author
Cáceres Briones, Juan Pablo
Associate professor
dc.contributor.other
Pérez Flores, Claudio
Associate professor
dc.contributor.other
Sipirán Mendoza, Iván
Admission date
dc.date.accessioned
2025-01-06T14:37:10Z
Available date
dc.date.available
2025-01-06T14:37:10Z
Publication date
dc.date.issued
2024
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/202610
Abstract
dc.description.abstract
Esta investigación aborda la detección y reconocimiento de instancias de objetos en tiempo real. Se centra en integrar un detector de objetos y un módulo de extracción de descriptores en una única red, utilizando YOLOv7 modificado y una CNN especializada, JPNet. El objetivo es desarrollar un sistema capaz de detectar objetos genéricos y extraer descriptores globales de manera eficiente. Para esto, se modificó YOLOv7, adaptándolo a la detección de objetos genéricos y se entrenó con COCO etiquetado con la red SAM. Este enfoque demostró superar la precisión de YOLOv7. Para el desarrollo del módulo extractor de descriptores, se diseñó JPNet, una arquitectura con operaciones RoI, GeM y Neck. Se investigó su integración con diferentes stages de YOLOv7 y se descubrió que conectado al stage 1 se obtienen los mejores descriptores. El sistema completo, YOLOv7 modificado con JPNet, se validó en términos de rendimiento y velocidad, demostrando ser eficaz en tiempo real con un F1-score promedio de 0.742 a 32 FPS. Se realizó una comparativa con YOLOSPoC, reconocedor de instancias de objetos en base a YOLO y descriptores SPoC, encontrando que aunque el sistema propuesto lo supera en ciertos escenarios, en el promedio de escenarios YOLOSPoC muestra un mejor rendimiento.
es_ES
Patrocinador
dc.description.sponsorship
Esta tesis ha sido parcialmente financiado por el proyecto FONDEQUIP EQM170041 y por
el proyecto BASAL AFB230001
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States