Title: | Dois ensaios de aprendizado de máquina em finanças : identificação de variáveis para previsão em alta frequência e comparação de modelos preditores de volatilidade |
Author: | Wagner, Rafael Silva |
Abstract: |
Esta dissertação busca verificar a capacidade de algoritmos de aprendizado de máquina resolverem problema típicos em finanças. Inicialmente serão utilizadas técnicas de seleção de variáveis para identificar, dentro de um conjunto de variáveis que resumem a dinâmica de negociação do ativo financeiro, aquelas que mais impactam a direção dos movimentos dos retornos futuros. Posteriormente, será avaliada a capacidade de algoritmos de aprendizado de máquina realizarem melhores previsões de volatilidade realizada, quando comparados aos modelos tradicionais de econometria. Apesar de muitos resultados teóricos já terem atestado a importância da dinâmica de negociação para a evolução do preço dos ativos financeiros, há divergência sobre qual seria a correta especificação do processo. Um problema atual, dado o alto volume de informação que se tornou disponível, é saber verificar quais são as variáveis mais importantes para a previsão do sinal dos retornos. Nesta dissertação, serão utilizados dois modelos de conjuntos de árvores, Boosting Trees e Random Forests, para identificar as variáveis relevantes para a previsão da direção futura dos preços de ativos financeiros, permitindo verificar onde estão e quais são as variáveis mais importantes, isto é, que mais afetam o sinal dos retornos. Também será verificado, nesta dissertação, a capacidade de modelos de aprendizado de máquina realizarem melhores previsões de volatilidade realizada, quando comparados aos modelos tradicionais da literaturaeconométrica. Será analisado se três modelos baseados em árvores, duas estruturas de penalização lineares e duas propostas de prioris bayesianas, são capazes de atingir melhor capacidade preditiva do que o principal modelo de previsão de volatilidade, o Heterogeneous AutoRegressive. Além disso, também será verificado se modelos de combinação de previsões são capazes de gerar superior capacidade preditiva. Abstract: This work will evaluates the ability of machine learningalgorithms to solve typical problems in finance. Initially,variable selection techniques are used to identify, within aset of variables that summarize the financial asset tradingdynamics, those that most impact the direction of themovements of future returns. Afterwards, the ability ofmachine learning algorithms to perform better predictionsof realized volatility is evaluated, when compared tothe traditional models of econometrics. Although manytheoretical results have already testified to the importanceof trading dynamics for the evolution of price of financialassets, there is a great deal of divergence as to whatwould be the correct specification of the process. A currentproblem, given the high volume of information that hasbecome available, is to know what are the most importantvariables for predicting the returns signal. In this work, twomodels of ensemble trees, Boosting Trees and RandomForests, will be used to identify the relevant variables forpredicting the future direction of financial asset prices,allowing to verify where they are and which are the mostimportant variables, that is, those that most affect thereturns signal. We also asses the ability of machine learningmodels to perform better predictions of realized volatilitywhen compared to traditional models of the econometricliterature. It is analyzed whether three tree-based models,two linear penalty structures and two Bayesian prioriproposals, are able to achieve better predictive capacitythan the main predictor of volatility, the HeterogeneousAuto-Regressive model. In addition, it is also consideredwhether forecasting combination techniques are capableof generating superior predictive ability. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Sócio Econômico, Programa de Pós-Graduação em Economia, Florianópolis, 2019 |
URI: | https://repositorio.ufsc.br/handle/123456789/214974 |
Date: | 2019 |
Files | Size | Format | View |
---|---|---|---|
PCNM0333-D.pdf | 2.685Mb |
View/ |