Aprendizaje reforzado de políticas robustas para navegación robótica local
Professor Advisor
dc.contributor.advisor
Ruiz del Solar, Javier
Author
dc.contributor.author
Leiva Castro, Francisco Ignacio
Associate professor
dc.contributor.other
Adams, Martin
Associate professor
dc.contributor.other
Morales Manzanares, Eduardo
Admission date
dc.date.accessioned
2021-06-11T22:57:20Z
Available date
dc.date.available
2021-06-11T22:57:20Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/180112
General note
dc.description
Tesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Eléctrica
es_ES
General note
dc.description
Memoria para optar al título de Ingeniero Civil Eléctrico
Abstract
dc.description.abstract
El problema de navegación autónoma en robótica móvil es uno de los más importantes del área, y consecuentemente, ha sido estudiado durante décadas. En esta tesis, este problema es abordado empleando aprendizaje reforzado. Considerando la descomposición de tareas que sigue la mayoría de los sistemas de navegación clásicos, el foco es puesto en dos sub-problemas específicos: evasión de colisiones, y planificación local. Si bien ambos sub-problemas han sido abordados usando aprendizaje reforzado anteriormente, en este trabajo se muestra que mejoras en desempeño, flexibilidad y aplicabilidad de las políticas entrenadas, pueden lograrse al representar las observaciones de los agentes mediante nubes de puntos 2D para la codificación de mediciones de rango. Mediante extensivas evaluaciones experimentales sobre los casos de estudio abordados, se comprueba que el desempeño final de los agentes mejora al adoptar la representación propuesta, en lugar de representaciones alternativas previamente estudiadas. También se verifica que el enfoque propuesto es compatible con el uso de representaciones diferentes para las observaciones, como imágenes y/o vectores. Finalmente, se muestra que este enfoque provee a los agentes con robustez frente a perturbaciones extremas sobre sus observaciones, y posibilita el aumento de sus capacidades perceptuales mediante estrategias de pre-procesamiento y/o fusión de datos sensoriales.
es_ES
Patrocinador
dc.description.sponsorship
CONICYT-PFCHA/Mag´ıster Nacional/2018-22182130, Proyecto FONDECYT 1161500 y Proyecto FONDECYT 1201170