Acelerando el aprendizaje reforzado de políticas de un agente móvil mediante retroalimentación correctiva
Tesis
Access note
Acceso abierto
Publication date
2022Metadata
Show full item record
Cómo citar
Ruiz del Solar, Javier
Cómo citar
Acelerando el aprendizaje reforzado de políticas de un agente móvil mediante retroalimentación correctiva
Author
Professor Advisor
Abstract
Uno de los grandes desafíos que posee la aplicación del aprendizaje reforzado profundo, es
la falta de eficiencia de muestras durante el entrenamiento de un agente, en otras palabras,
el agente requiere de muchas iteraciones para converger a un comportamiento deseado.
Un enfoque utilizado para lidiar con este problema, es el de acelerar el aprendizaje de un
agente mediante el uso de feedback correctivo junto con el uso de recompensas.
Dada esta situación, se propone en este trabajo el incorporar una señal de retroalimenta-
ción correctiva para mejorar la eficiencia del aprendizaje de la política o comportamiento de
un agente, en particular, la eficiencia de muestras durante su entrenamiento.
Para llevar esto a cabo, se busca implementar un algoritmo híbrido, compuesto por un
algoritmo de aprendizaje reforzado profundo (DDPG) y un algoritmo de aprendizaje de má-
quinas interactivo (D-COACH). Este será empleado sobre un agente robótico móvil, con el
fin de llevar a cabo la tarea de navegación autónoma, más en especifico, la de planificación
local en 2D, en un ambiente de simulación.
El algoritmo híbrido propuesto, se contrasta con los algoritmos utilizados para su cons-
trucción, DDPG y D-COACH, además de un algoritmo secuencial compuesto por ambos.
Se compara la eficiencia de muestras entre estos algoritmos y el desempeño que logra cada
uno, mediante una evaluación sobre el mismo ambiente de entrenamiento y validación en un
ambiente nunca antes visto por el agente.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniera Civil Eléctrica
Patrocinador
Proyecto FONDECYT 1201170
Identifier
URI: https://repositorio.uchile.cl/handle/2250/191815
Collections
The following license files are associated with this item: