Show simple item record

Professor Advisordc.contributor.advisorRamírez Cabrera, Héctor
Professor Advisordc.contributor.advisorPañaloza González, Andrés
Authordc.contributor.authorVilchez Valenzuela, Enrique Esteban 
Associate professordc.contributor.otherSoto San Martín, José
Associate professordc.contributor.otherGuzmán Paredes, Cristóbal
Admission datedc.date.accessioned2021-06-16T15:48:47Z
Available datedc.date.available2021-06-16T15:48:47Z
Publication datedc.date.issued2021
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/180149
General notedc.descriptionTesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Matemáticas Aplicadases_ES
General notedc.descriptionMemoria para optar al título de Ingeniero Civil Matemático
Abstractdc.description.abstractEn las formulaciones matemáticas más conocidas de los problemas de ruteo de vehículos es asumido que todos los clientes son conocidos desde un principio, permitiendo construir soluciones planificadas. Sin embargo, en situaciones más realistas suele suceder que algunos clientes sean conocidos después del periodo de planificación, cuando los vehículos ya están en sus rutas. Esto implica que la optimización tenga que hacerse en tiempo real para poder atender a aquellos clientes que lleguen de forma dinámica. Esta variación es conocida como el problema de ruteo de vehículos dinámico, el cual será estudiado en esta tesis. En este trabajo se propone abordar el problema desde el enfoque del aprendizaje de máquinas y los datos a través de algoritmos de aprendizaje reforzado. En esta clase de métodos, se modela el problema a través de un proceso de decisión de Markov, en el cual un agente busca maximizar una función de recompensas que va a depender de las acciones que tome en cada estado. Como primera opción se usan los algoritmos del tipo "Q-learning" y "Actor-Critic", ampliamente citados en el área. Por otro lado, se desarrolla un algoritmo que permite aprender a partir de simulaciones de escenarios, cuando se tiene información estocástica del medio. Se presentan una serie de experimentos computacionales para medir el desempeño de los modelos entrenados y se comparan con un algoritmo que utiliza una estrategia de "reoptimización" para tener una mejor apreciación de sus ventajas y desventajas.es_ES
Patrocinadordc.description.sponsorshipAgencia Nacional de Investigación y Desarrollo/Subdirección de Capital Humano/Magíster Nacional/2020 - 22201628, CMM ANID PIA AFB170001 y Entel S.A.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 Chile*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/*
Keywordsdc.subjectAprendizaje de máquinaes_ES
Keywordsdc.subjectRedes neuronales (Ciencia de la computación)es_ES
Keywordsdc.subjectAsignación de tráficoes_ES
Títulodc.titleAlgoritmos de aprendizaje reforzado para el problema de ruteo de vehículos dinámicoes_ES
Document typedc.typeTesis
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Matemáticaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Chile
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile