Aplicación de deep learning para predicción de índices bursátiles extranjeros usando modelos multivariados recurrentes y convolucionales con mecanismos de atención
Tesis
Open/ Download
Access note
Acceso abierto
Publication date
2024Metadata
Show full item record
Cómo citar
Díaz Solís, David
Cómo citar
Aplicación de deep learning para predicción de índices bursátiles extranjeros usando modelos multivariados recurrentes y convolucionales con mecanismos de atención
Author
Professor Advisor
Abstract
Este trabajo aplica deep learning, o modelos de redes neuronales profundas, para predecir
los precios/retornos y la dirección del movimiento de índices financieros ETF (exchange trade
fund) de los fondos de inversión BlackRock, Vanguard, Invesco y State Street, transados entre los
años 1993 y 2023 en la Bolsa de Comercio NYSE (new york stock exchange). La aplicación
combina modelos de redes neuronales convolucionales ConvNet (convolutional neural network), y
redes recurrentes (recurrent neural network), entre las que se incluyen de memoria de largo y corto
plazo LSTM (long short term memory), GRUs (gated recurrent units) y Bi-direccionales Bi-LSTM
y Bi-GRU (bidirectional networks) con y sin mecanismos de atención del tipo Luong, Badahnau,
Soft Attention y MultiHead Attention.
Los modelos univariados y multivariados se evalúan mediante métricas clásicas de error
MSE (mean square error), RMSE (root mean square error), MAE (mean absolute error), MAPE
(mean absolute percentage error) y MDAPE (median absolute percentage error), junto con la
métrica de dirección DA (directional accuracy), y se comparan con los modelos benchmark
correspondientes a ARIMA (autoregressive-integrated moving average), MLP (multilayer
perceptron) y ARIMAX (ARIMA-eXogenous). Finalmente, a los modelos Top10 con mejores
métricas se les aplica un proceso de optimización de hiper-parámetros utilizando las librerías
AutoKeras y SciKeras, además de re-estimarlos consecutivamente en ventanas deslizantes o rolling
windows. Finalmente, los mejores modelos son evaluados en su capacidad de generar rentabilidad y
en su relación de riesgo-retorno al seguir diferentes estrategias de trading realizando una
simulación del tipo backtesting.
El presente trabajo supera el state-of-art de la literatura en relación a las métricas clásicas
de error predicción. En específico, en la predicción de precios del ETF Vanguard (VTI) el modelo
univariado Bi-GRU con atención Luong(dot-product) obtuvo MAE 0,0013302, MSE 2,681E-06,
RMSE 0,0014958 y MAPE 0,01188 (1,188%)
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Actividad Formativa Equivalente optar al grado de Magíster en Sistemas de Información e Inteligencia de Negocios
Identifier
URI: https://repositorio.uchile.cl/handle/2250/201498
Collections
The following license files are associated with this item: