Show simple item record

Professor Advisordc.contributor.advisorMuñoz Martínez, Gonzalo
Authordc.contributor.authorBadilla Mera, Fabián Alex
Associate professordc.contributor.otherGoycoolea Guzmán, Marcos
Associate professordc.contributor.otherTobar Henríquez, Felipe
Admission datedc.date.accessioned2024-05-09T20:11:54Z
Available datedc.date.available2024-05-09T20:11:54Z
Publication datedc.date.issued2023
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/198500
Abstractdc.description.abstractDurante el desarrollo de esta tesis, se estudian diversas aplicaciones de un modelo de optimizaci´on entera (MIP) para la representaci´on de redes neuronales fully connected con ReLU’s como funci´on de activaci´on. Los resultados obtenidos se pueden extender a casos m´as generales como redes feedforward con funciones de activaci´on piecewise linear [1]. En el Cap´ıtulo 1, se hace una introducci´on al problema y se presentan los conocimientos te´oricos previos de optimizaci´on y aprendizaje de m´aquinas necesarios para el desarrollo de la tesis. Tambi´en, se introduce el IP maestro que se utilizar´a (Big-M) y se explican sus restricciones. En el Cap´ıtulo 2, se indican todas las precauciones t´ecnicas que hay que tomar en cuenta para modelar una red neuronal usando este problema IP. Luego se presentan algunos algoritmos para calcular las cotas de activaci´on, las cuales son valores asociados a cada neurona que resultan ser sumamente importante en este modelo IP. Se hacen diversos estudios emp´ıricos para determinar cuales son las maneras apropiadas de calcularlas y que calidad tienen estas cotas calculadas. En el Cap´ıtulo 3, se resuelve un problema de verificaci´on de redes utilizando el modelo IP, con el fin de analizar el impacto que tienen las cotas de activaci´on, su calidad, y el c´omo fueron calculadas: versi´on naive, relajada, entera, entre otras. De este cap´ıtulo se obtiene el marco te´orico ideal para el uso de este modelo IP. En el Cap´ıtulo 4, se utilizan todos los resultados anteriores para implementar un comparador de redes neuronales, utilizando una modificaci´on del modelo IP original. Se realizan diversas pruebas con el comparador, utilizando redes entrenadas con MNIST, y se estudia el comportamiento de las redes, realizando distintas comparaciones. Se concluye que el desarrollo de esta herramienta es posible, tiene gran versatilidad y puede aportar a ambas comunidades (IP, ML), pero requiere estudios posteriores para analizar como escala con el tama˜no de las redes, del dataset y con otras arquitecturas. Finalmente, en las conclusiones, se enumeran los principales aportes de la tesis y se mencionan l´ıneas de trabajo futuro tanto para la comunidad IP como la de ML.es_ES
Patrocinadordc.description.sponsorshipProyecto Fondecyt 11190515 y CMM ANID BASAL FB210005es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleTécnicas de optimización discreta para compresión de redes neuronaleses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Matemáticaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.carrerauchile.carreraIngeniería Civil Matemáticaes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Matemáticas Aplicadases_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Matemático


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States