Métodos de aprendizaje de máquinas para la optimización de portafolios de inversión de criptomonedas
Professor Advisor
dc.contributor.advisor
Orchard Concha, Marcos
Author
dc.contributor.author
Zurita Tapia, Ignacio Andrés
Associate professor
dc.contributor.other
Paut Mardones, Roberto
Associate professor
dc.contributor.other
Silva Sánchez, Jorge
Admission date
dc.date.accessioned
2024-07-31T17:29:19Z
Available date
dc.date.available
2024-07-31T17:29:19Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.other
10.58011/3cbf-nv41
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/199833
Abstract
dc.description.abstract
El principal objetivo del presente trabajo de tesis consiste en estudiar el problema de
optimización de portafolios de inversión en el mercado de criptomonedas. Para ello, se implementa una metodología existente diseñada para estos fines (basada en aprendizaje reforzado
profundo) y se proponen diferentes modificaciones y experimentos con la finalidad de analizar su comportamiento ante diferentes escenarios. Entre las configuraciones experimentales
propuestas se encuentran: (1) Un nuevo conjunto de datos de evaluación conformado por
cinco particiones datos con variabilidad entre sus tendencias predominantes, con la finalidad
de aumentar la rigurosidad a la hora de comparar diferentes modelos, (2) uso del dólar (en
específico Tether) como moneda base debido a su alta estabilidad en comparación con el
Bitcoin, divisa comúnmente utilizada para aquello, (3) uso del sharpe ratio como función de
recompensa para el modelamiento mediante aprendizaje reforzado con la hipótesis de que se
obtendrán modelos con mejor control de riesgo y por último, (4) se propone una forma aleatoria de inicializar el historial de decisiones denominado Portfolio Vector Memory (PVM), con
la intención de facilitar la tarea exploratoria de los modelos, considerando que originalmente
se inicializaba de manera uniforme.
Dentro de las principales conclusiones obtenidas, se pueden mencionar que, tanto el uso de
la función de recompensa sharpe ratio, como la inicialización aleatoria del PVM, aparentemente mejoran las métricas de riesgo durante la evaluación, comportamiento principalmente
observado en términos de la métrica Maximum Drawdown (MDD). Por otro lado, los resultados no fueron concluyentes para confirmar la hipótesis de que la inicialización aleatoria del
PVM mejora la capacidad exploratoria de los modelos, puesto que no se observaron indicios
significativos en las decisiones tomadas por los diferentes modelos entrenados. Finalmente,
otro componente relevante en la metodología estudiada, es el mecanismo de entrenamiento continuo denominado OSBL (Online Stochastic Batch Learning), diseñado originalmente
para adaptar el modelo entrenado a nuevos datos dada la alta volatilidad presente en los
mismos. De acuerdo a los resultados se pudo comprobar que este mecanismo no es del todo
efectivo para adaptar a los modelos a nuevos escenarios.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States