Além da caixa preta: aprendizagem de máquina interpretável para previsão de séries temporais macroeconômicas brasileiras

DSpace Repository

A- A A+

Além da caixa preta: aprendizagem de máquina interpretável para previsão de séries temporais macroeconômicas brasileiras

Show full item record

Title: Além da caixa preta: aprendizagem de máquina interpretável para previsão de séries temporais macroeconômicas brasileiras
Author: Kava, Lucas Eduardo
Abstract: Previsões de séries temporais são de grande interesse de macroeconomistas, mas encontrar modelos que apresentem resultados mais precisos ainda é um desafio para os pesquisadores da área. Essa dissertação busca avaliar o desempenho preditivo de algoritmos de aprendizagem de máquina como alternativa aos modelos econométricos tradicionais para a previsão de séries macroeconômicas brasileiras, com aplicação de métodos de interpretação agnóstica para melhor compreensão dos resultados fornecidos por aprendizagem de máquina. Com 126 variáveis da economia brasileira entre Fevereiro/2003 até Abril/2021, buscamos prever quatro séries de bastante interesse econômico -- o IPCA - Geral, o IBC-Br, a taxa de desemprego da PNAD e a taxa de juros SELIC acumulada no mês -- a partir dos modelos de aprendizagem de máquina de regressão penalizada, redes neurais, XGBoost e florestas aleatórias; e de modelos econométricos tradicionais: ARMA, VAR e FAVAR. Nossos resultados mostraram um melhor desempenho dos modelos de aprendizagem de máquina em três das quatro séries avaliadas. Em média para as quatro séries, florestas aleatórias mostraram menores valores para RMSE, já para o MAE os menores resultados foram para regressão penalizada. Por meio da metodologia de Model Confidence Set, também observa-se a presença dos modelos de aprendizagem de máquina entre o conjunto de melhores modelos, em geral com regressão penalizada e florestas aleatórias disputando o pódio de primeiro lugar. A análise de interpretação agnóstica mostrou uma maior importância de preditores referentes aos índices de preços para previsão do IPCA nos modelos de aprendizagem de máquina, ao passo que para o IBC-Br notam-se preditores relacionados ao setor financeiro nacional e internacional. No caso da taxa de desemprego, apesar do melhor desempenho do modelo ARMA na previsão, os modelos de aprendizagem também apontaram uma maior importância para o passado da própria série para a previsão da mesma. A previsão da série da SELIC também mostrou uma importância muito grande da própria série defasada, chamando atenção o resultado de florestas aleatórias que mostrou um comportamento de regra de política monetária para a previsão da série ao incluir variáveis relativas as expectativas sobre o índice de preços IPCA e também de outros índices gerais de preços. Com nossos resultados favorecendo modelos de aprendizagem de máquina, esperamos incentivar o uso dos mesmos juntamente à métodos de interpretabilidade dos resultados em macroeconomia, propiciando melhores previsões que são de grande utilidade aos formuladores de política econômica.Abstract: Time series forecasting is of great interest to macroeconomists, however finding models that present more accurate results is still a challenge for researchers in the field. This dissertation looks for evaluating the predictive performance of machine learning algorithms as a alternative for traditional econometric models for the prediction of brazilian macroeconomic time series, with the application of agnostic interpretation methods for a better understanding of the results provided by machine learning. Using 126 variables from the Brazilian economy between February/2003 to April/2021, we seek to predict four series of great economic interest -- the inflation rate given by the IPCA - General index, the output growth given by the IBC-Br index, the PNAD unemployment rate and the accumulated SELIC interest rate -- using machine learning models of penalized regression, neural networks, XGBoost and random forests; and traditional econometric models: ARMA, VAR and FAVAR. Our results indicated a better performance of machine learning models in three out of the four series evaluated. On average across the four series, random forests showed lower values for RMSE, while for MAE the lowest results were obtained with penalized regression. Through the Model Confidence Set methodology, the presence of machine learning models is also observed among the set of best models, in general with penalized regression and random forests vying for the first place podium. The analysis of agnostic interpretation indicated a greater importance of predictors related to price indexes for forecasting the IPCA in machine learning models, while for the IBC-Br there are predictors related to the national and international financial sector. In the case of the unemployment rate, despite the better performance of the ARMA model in forecasting, the machine learning models also showed greater importance to the lagged value of the series for its prediction. The forecast of the SELIC series also showed a very great importance of the lagged series itself, drawing attention to the result of random forests that showed a behavior of monetary policy rule for the forecasting by including variables related to expectations about the IPCA price index and also other general price indices. With our results favoring machine learning models, we hope to encourage using machine learning methods with methods of agnostic interpretation in macroeconomics, therefore providing better forecasts that are of great importance to economic policymakers.
Description: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Sócio-Econômico, Programa de Pós-Graduação em Economia, Florianópolis, 2022.
URI: https://repositorio.ufsc.br/handle/123456789/234659
Date: 2022


Files in this item

Files Size Format View
PCNM0375-D.pdf 1.433Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar