Análise comparativa das metodologias de Markowitz, Kelly e Aprendizado por Reforço em Carteiras de Investimentos - uma abordagem computacional

Data
2021-03-02
Tipo
Trabalho de conclusão de curso
Título da Revista
ISSN da Revista
Título de Volume
Resumo
Aprendizado de Máquina é o campo de estudo da inteligência artificial que estuda a descoberta automatizada de padrões e vem sendo amplamente utilizado nas pesquisas acadêmicas e nos mais diversos setores da indústria (JEWELL, 2019).A abordagem por aprendizado por reforço é uma das maneiras de se reconhecer padrões, especificamente em cenários em que não se é possível o treinamento para todas as ocasiões e o agente computacional deve aprender com sua própria experiência, (SUTTON; BARTO, 2020). No mercado financeiro a busca por maximizar a lucratividade de uma carteira de investimentos é o maior desafio dos investidores. Diferentes abordagens já foram utilizadas para análise do problema, como a divisão do risco em um sistema fechado por meio da diversificação dos ativos, como proposto por Markowitz (MARKOWITZ, 1952), ou por meio de abordagem probabilística, como muitos pesquisadores aplicam através do sistema científico de apostas proposto por John Kelly (MACLEAN; ED, 2006). O objetivo principal deste trabalho de conclusão de curso foi realizar o desenvolvimento das diferentes abordagens de otimização de carteira de investimentos propostos por Markowitz, Kelly e aprendizado por reforço. Uma análise comparativa dos retornos financeiros e computacional dos resultados obtidos, buscando verificar o desempenho por inteligência artificial frente as outras estratégias. Os algoritmos de DDPG e PPO foram utilizados para treinamento dos modelos e a implementação do projeto foi com a linguagem de programação Python (ROSSUM; DRAKE, 2009) e de suas bibliotecas disponíveis em código aberto. Séries históricas das ações presentes na Bolsa de Valores de São Paulo entre os anos de 2010 e 2019 foram coletadas através da biblioteca yahooquery (GUTHRIE, 2020) e utilizadas para execução dos experimentos. Os resultados obtidos mostram que a abordagem por Aprendizado por Reforço é uma estratégia eficiente para alocação de carteiras em um ambiente dinâmico como o do mercado de renda variáveis, atingindo retorno acumulado de 151,7% entre o período simulado, Junho de 2017 a Dezembro de 2019. Foi a segunda metodologia mais custosa em termos de processamento para a construção de uma única carteira, enquanto Kelly obteve os resultados mais rápidos, por volta de 14 segundos e a abordagem modificada de Markowitz obteve contabilizações de até 4000 segundos de processamento.
Descrição
Citação
FRANCHI, B. O.; SATO, R. C. . Análise comparativa das metodologias de Markowitz, Kelly e Aprendizado por Reforço em Carteiras de Investimentos - uma abordagem computacional. 2020.
Pré-visualização PDF(s)