Aprendizaje reforzado fuera de línea en control no lineal de estanques

Fabry Gil, Jorge Andrés

Professor Advisor	dc.contributor.advisor	Orchard Concha, Marcos
Author	dc.contributor.author	Fabry Gil, Jorge Andrés
Associate professor	dc.contributor.other	Sáez Hueichapan, Doris
Associate professor	dc.contributor.other	Yuz Eissmann, Juan
Admission date	dc.date.accessioned	2022-12-28T12:48:27Z
Available date	dc.date.available	2022-12-28T12:48:27Z
Publication date	dc.date.issued	2022
Identifier	dc.identifier.other	10.58011/1508-be45
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/191230
Abstract	dc.description.abstract	En la presente tesis se estudia el uso de Random Ensemble Mixture de Deep Q-Network (REM), método de Reinforcement Lerning (RL) Off-policy en un entorno Offline. El aporte de esta tesis está en demostrar la factibilidad de utilizar esta metodología sobre bases de datos construidas por controladores aleatorios sobre una planta no lineal, mejorando la recompensa promedio. Previamente, se han utilizado algoritmos Off-policy para recorrer de forma efectiva la cadena de decisión de Markov. Para mejorar la generalización fuera de línea se utiliza REM, un robusto algoritmo de Q-learning (aprendizaje de la función de recompensa Q) el cual impone consistencia de las ecuaciones de Bellman en combinaciones convexas aleatorias de múltiples estimadores de la función Q. Como ambiente se utiliza un estanque cónico, representado en un ambiente virtual GYM (ambiente clásico para probar algoritmos de RL) y simulaciones en Python. Creando con estos tres bases de datos, dos generadas a partir de agentes DQN interactuando con el ambiente y una generada mediante el control de agentes controladores Proporcional, Integral y Derivativo (PID) sobre las simulaciones en Python. Con estas bases de datos se entrenan agentes, observando la capacidad de obtener mejores políticas finales y robustez frente a desperfectos y perturbaciones.	es_ES
Patrocinador	dc.description.sponsorship	FONDECYT 1210031	es_ES
Lenguage	dc.language.iso	es	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
Keywords	dc.subject	Aprendizaje de máquina
Keywords	dc.subject	Deep learning
Keywords	dc.subject	Aprendizaje reforzado fuera de linea
Keywords	dc.subject	Rainforcement Learning
Keywords	dc.subject	Random Ensemble Mixture
Título	dc.title	Aprendizaje reforzado fuera de línea en control no lineal de estanques	es_ES
Document type	dc.type	Tesis	es_ES
dc.description.version	dc.description.version	Versión original del autor	es_ES
dcterms.accessRights	dcterms.accessRights	Acceso abierto	es_ES
Cataloguer	uchile.catalogador	gmm	es_ES
Department	uchile.departamento	Departamento de Ingeniería Eléctrica	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.titulacion	uchile.titulacion	Doble Titulación	es_ES
uchile.carrera	uchile.carrera	Ingeniería Civil Eléctrica	es_ES
uchile.gradoacademico	uchile.gradoacademico	Magister	es_ES
uchile.notadetesis	uchile.notadetesis	Tesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Eléctrica	es_ES
uchile.notadetesis	uchile.notadetesis	Memoria para optar al título de Ingeniero Civil Eléctrico

Files in this item

Name:: Aprendizaje-reforzado-fuera-de ...
Size:: 10.29Mb
Format:: PDF

Name:: TablaConten.pdf
Size:: 144.2Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Postgrado
Tesis Postgrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States