Show simple item record

Professor Advisordc.contributor.advisorSaavedra Rondo, José Manuel
Authordc.contributor.authorBáez Mena, Sergio Iván
Associate professordc.contributor.otherBustos Cárdenas, Benjamín
Associate professordc.contributor.otherCerda Villablanca, Mauricio
Admission datedc.date.accessioned2024-08-08T20:18:49Z
Available datedc.date.available2024-08-08T20:18:49Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/200071
Abstractdc.description.abstractLa segmentación semántica es una de las principales tareas de visión cuyo objetivo es la clasificación de cada pixel en una imagen dentro de una categoría. Esta tarea está siendo aplicada en distintas áreas de la industria, teniendo un incipiente uso en el monitoreo de arbolado urbano que consiste en el censo y medición del estado de salud de los árboles pertenecientes a una ciudad. En la presente memoria se persiguen dos objetivos. El primero consiste en la evaluación de distintos tipos de vision transformers sobre un nuevo dataset de arbolado urbano denominado TreeSegmentation, perteneciente al proyecto Arbocensus. En particular, los modelos evaluados pertenecen a las categorías: escala uniforme, multiescala y clasificación de máscaras. Por su parte, el segundo objetivo es la evaluación del primer foundation model para segmentación Segment Anything Model (SAM). Más específicamente, se busca transferir las características desde su image encoder. Los experimentos realizados arrojaron que el mejor desempeño obtenido corresponde al modelo de clasificación de máscaras Mask2Former con 87.21 mIoU. Otro resultado relevante es la ventaja mostrada por los modelos multiescala por sobre los de escala uniforme evaluados, estando los primeros arriba por 5 mIoU en una de las categorías. Por último, el uso del image encoder de SAM mostró buenos resultados, alcanzando un desempeño de 86.60 mIoU con el modelo SAM-Mask. Sin embargo, para determinar la magnitud de los beneficios se requiren más experimentos.es_ES
Patrocinadordc.description.sponsorshipFONDECYT 21I10360es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleEvaluación de visión transformers y Segment Anything Model para segmentación semántica en el monitoreo de arbolado urbanoes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil en Computaciónes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States