Aprendizaje reforzado fuera de línea en control no lineal de estanques
Professor Advisor
dc.contributor.advisor
Orchard Concha, Marcos
Author
dc.contributor.author
Fabry Gil, Jorge Andrés
Associate professor
dc.contributor.other
Sáez Hueichapan, Doris
Associate professor
dc.contributor.other
Yuz Eissmann, Juan
Admission date
dc.date.accessioned
2022-12-28T12:48:27Z
Available date
dc.date.available
2022-12-28T12:48:27Z
Publication date
dc.date.issued
2022
Identifier
dc.identifier.other
10.58011/1508-be45
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/191230
Abstract
dc.description.abstract
En la presente tesis se estudia el uso de Random Ensemble Mixture de Deep Q-Network
(REM), método de Reinforcement Lerning (RL) Off-policy en un entorno Offline. El aporte
de esta tesis está en demostrar la factibilidad de utilizar esta metodología sobre bases de datos
construidas por controladores aleatorios sobre una planta no lineal, mejorando la recompensa
promedio. Previamente, se han utilizado algoritmos Off-policy para recorrer de forma efectiva
la cadena de decisión de Markov.
Para mejorar la generalización fuera de línea se utiliza REM, un robusto algoritmo de
Q-learning (aprendizaje de la función de recompensa Q) el cual impone consistencia de las
ecuaciones de Bellman en combinaciones convexas aleatorias de múltiples estimadores de la
función Q.
Como ambiente se utiliza un estanque cónico, representado en un ambiente virtual GYM
(ambiente clásico para probar algoritmos de RL) y simulaciones en Python. Creando con estos tres bases de datos, dos generadas a partir de agentes DQN interactuando con el ambiente
y una generada mediante el control de agentes controladores Proporcional, Integral y Derivativo (PID) sobre las simulaciones en Python. Con estas bases de datos se entrenan agentes,
observando la capacidad de obtener mejores políticas finales y robustez frente a desperfectos
y perturbaciones.
es_ES
Patrocinador
dc.description.sponsorship
FONDECYT 1210031
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States