Show simple item record

Professor Advisordc.contributor.advisorFontbona Torres, Joaquín
Authordc.contributor.authorWortsman Zurich, Arie
Associate professordc.contributor.otherRemenik Zisis, Daniel
Associate professordc.contributor.otherTobar Henríquez, Felipe
Associate professordc.contributor.otherPetrache, Mircea
Admission datedc.date.accessioned2023-07-21T20:35:22Z
Available datedc.date.available2023-07-21T20:35:22Z
Publication datedc.date.issued2023
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/194923
Abstractdc.description.abstractEl Aprendizaje de Máquinas, y en particular las redes neuronales, han existido en la comunidad científica desde la década de 1980. Sin embargo, han sido adoptadas como una práctica común sólo en la última década, con la nueva disponibilidad de capacidad computacional. En la última década, el aprendizaje de máquinas y especialmente el aprendizaje profundo han visto muchos avances, alcanzando grandes hitos en tareas particularmente difíciles en visión computacional, generación de audio, clasificación, salud, bioinformática y muchos otros campos. Pese a que ha habido grandes logros en los últimos años por el uso de redes neuronales, el por qué estas funcionan, y en particular, por qué generalizan bien pese a estar altamente sobre parametrizadas, aún no es comprendido completamente (por ejemplo, Alexa-net de Google s tiene alrededor de 108 parámetros). En este contexto, motivado por las aplicaciones de la Teoría de Probabilidad en Mecánica Estadística, una línea de investigación ha propuesto estudiar el objeto matemático que surge cuándo el ancho de la red tiende a infinito. Dado que las redes neuronales clásicas son claramente inestables en el límite cuando la cantidad de neuronas tiene a infinito, se necesitan otras parametrizaciones para poder estudiar estos objetos matemáticos. Dos parametrizaciones han ganado especial popularidad: La parametrización del NTK,y al parametrización de Campo Medio. Ambas parametrizaciones han sido ampliamente estudiadas, pero en el caso del NTK, no se han encontrado límites en términos de Ecuaciones en Derivadas Parciales (EDPs), que si es el caso en las parametrizaciones de Campo Medio. Además, un fenómeno llamado Lazy Training, que consiste en la distribución de los parámetros siendo muy similar a la distribución inicial, fue reportado por Chizat and Bach en 2018 para la parametrización del NTK. En este trabajo, estudiamos el límite de la parametrización del NTK para redes poco profundas (con una capa escondida) entrenadas con descenso de gradiente estocástico usando medidas empíricas. Con esto, encontramos EDPs límite que no han sido parte de la literatura. Por otra parte, también se estudia el límite de la red cuando la cantidad de neuronas tiende a infinito, para lo que se ocupan herramientas de transporte óptimo. También se estudia el límite cuando el tiempo de entrenamiento es largo en este setting.es_ES
Patrocinadordc.description.sponsorshipProyecto FONDECYT 1201948 CMM ANID BASAL FB210005es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleContributions to the study of the neural tangent kernel regime from a mean field perspectivees_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Matemáticaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.carrerauchile.carreraIngeniería Civil Matemáticaes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Matemáticas Aplicadases_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Matemático


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States