Show simple item record

Professor Advisordc.contributor.advisorPérez Flores, Claudio
Authordc.contributor.authorRojas Vilar, Daniel 
Associate professordc.contributor.otherEstévez Valencia, Pablo
Associate professordc.contributor.otherZegers Fernández, Pablo
Admission datedc.date.accessioned2021-08-30T23:02:53Z
Available datedc.date.available2021-08-30T23:02:53Z
Publication datedc.date.issued2021
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/181656
General notedc.descriptionTesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Eléctricaes_ES
General notedc.descriptionMemoria para optar al título de Ingeniero Civil Eléctrico
Abstractdc.description.abstractEn esta tesis se propone una metodología para entrenar modelos de segmentación semántica utilizando imágenes anotadas únicamente con descripciones en lenguaje natural. En los trabajos previamente publicados, se asignan etiquetas semánticas a fragmentos de descripciones mediante búsqueda exacta de nombres de clases. Luego se utilizan modelos entrenados para localizar texto arbitrario en imágenes para generar máscaras de segmentación artificiales, con las que se entrenan métodos supervisados. En esta tesis, se propone aprovechar la estructura sintáctica de las descripciones, junto con información semántica de una base de conocimiento, para mejorar la detección de categorías relevantes, además de identificar atributos y categorías complementarias. El método propuesto no requiere de anotaciones adicionales, por lo que puede extenderse fácilmente a nuevas aplicaciones. Se presenta además una red de localización, que se entrena para predecir exclusivamente las etiquetas generadas, lo que focaliza su entrenamiento en información relevante, mejorando los mapas de localización resultantes. Finalmente, se describe un método para obtener máscaras de segmentación más precisas y completas, aprovechando todos los tipos de mapas generados. Esta metodología se valida mediante varios experimentos en la base de datos MS-COCO, demostrando que supera por un amplio margen todos los métodos anteriores basados en supervisión a nivel de imagen.es_ES
Patrocinadordc.description.sponsorshipANID (CONICYT) a través de los proyectos FONDEF ID16I20290, FONDECYT 1191610, así como el Departamento de Ingeniería Eléctrica (DIE) y el Advanced Mining Technology Center (ANID Project AFB180004)es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 Chile*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/*
Keywordsdc.subjectComputadores - Procesamiento de imagen
Keywordsdc.subjectSemántica - Procesamiento de datos
Keywordsdc.subjectProcesamiento de textos (Ciencia de la computación)
Keywordsdc.subjectAprendizaje profundo
Títulodc.titleSegmentación semántica con supervisión débil utilizando descripciones en lenguaje naturales_ES
Document typedc.typeTesis
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulación


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Chile
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile