Show simple item record

Professor Advisordc.contributor.advisorRuiz del Solar San Martín, Javier
Professor Advisordc.contributor.advisorLoncomilla Zambrana, Patricio
Authordc.contributor.authorDíaz Villa, José Ignacio
Associate professordc.contributor.otherVerschae Tannenbaum, Rodrigo
Associate professordc.contributor.otherSipirán Mendoza, Iván
Admission datedc.date.accessioned2024-07-26T17:51:45Z
Available datedc.date.available2024-07-26T17:51:45Z
Publication datedc.date.issued2024
Identifierdc.identifier.other10.58011/s2w3-7m21
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/199763
Abstractdc.description.abstractSe propuso la arquitectura multimodal YotoR para la detección de objetos. Esta combina la extracción de características de Swin Transformer con el discriminador de YoloR y su modelamiento del conocimiento implícito. Los modelos YotoR logran un mejor mAP en comparación con sus partes por separado, con YotoR Bp4 alcanzando un mAP del 53.6 % en val2017, superando tanto a YoloR P6 como a Swin B. Además de mejorar el rendimiento de detección, los modelos YotoR ofrecen mejoras significativas en el tiempo de inferencia, destacando Swin Transformer con menor tiempo sin comprometer su desempeño. Se abren posibilidades para futuras investigaciones: como explorar si la mejora en el rendimiento se debe principalmente a la combinación con la cabeza de Yolo V4 o al conocimiento implícito. También se sugiere investigar más a fondo la optimización del tiempo de inferencia de los modelos YotoR y su aplicabilidad en aplicaciones en tiempo real. El trabajo confirma la hipótesis inicial: que una arquitectura híbrida combinando elementos de las arquitecturas Yolo y Transformers puede superar el rendimiento de cada una de sus partes por separado, lo que respalda la idea de colaboraciones arquitectónicas en la detección de objetos y la visión por computadora.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleYotor-You only transform one representation: redes unificadas con transformers para la detección de objetoses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoEscuela de Postgrado y Educación Continuaes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctrica
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencias de Datoses_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniería Civil Eléctrica


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States