Análise comparativa das metodologias de Markowitz, Kelly e Aprendizado por Reforço em Carteiras de Investimentos - uma abordagem computacional
Arquivos
Data
2021-03-02
Tipo
Trabalho de conclusão de curso
Título da Revista
ISSN da Revista
Título de Volume
Resumo
Aprendizado de Máquina é o campo de estudo da inteligência artificial que estuda a
descoberta automatizada de padrões e vem sendo amplamente utilizado nas pesquisas
acadêmicas e nos mais diversos setores da indústria (JEWELL, 2019).A abordagem por
aprendizado por reforço é uma das maneiras de se reconhecer padrões, especificamente
em cenários em que não se é possível o treinamento para todas as ocasiões e o agente
computacional deve aprender com sua própria experiência, (SUTTON; BARTO, 2020). No
mercado financeiro a busca por maximizar a lucratividade de uma carteira de investimentos
é o maior desafio dos investidores. Diferentes abordagens já foram utilizadas para análise
do problema, como a divisão do risco em um sistema fechado por meio da diversificação dos
ativos, como proposto por Markowitz (MARKOWITZ, 1952), ou por meio de abordagem
probabilística, como muitos pesquisadores aplicam através do sistema científico de apostas
proposto por John Kelly (MACLEAN; ED, 2006). O objetivo principal deste trabalho de
conclusão de curso foi realizar o desenvolvimento das diferentes abordagens de otimização
de carteira de investimentos propostos por Markowitz, Kelly e aprendizado por reforço.
Uma análise comparativa dos retornos financeiros e computacional dos resultados obtidos,
buscando verificar o desempenho por inteligência artificial frente as outras estratégias.
Os algoritmos de DDPG e PPO foram utilizados para treinamento dos modelos e a
implementação do projeto foi com a linguagem de programação Python (ROSSUM;
DRAKE, 2009) e de suas bibliotecas disponíveis em código aberto. Séries históricas das
ações presentes na Bolsa de Valores de São Paulo entre os anos de 2010 e 2019 foram
coletadas através da biblioteca yahooquery (GUTHRIE, 2020) e utilizadas para execução
dos experimentos. Os resultados obtidos mostram que a abordagem por Aprendizado por
Reforço é uma estratégia eficiente para alocação de carteiras em um ambiente dinâmico
como o do mercado de renda variáveis, atingindo retorno acumulado de 151,7% entre o
período simulado, Junho de 2017 a Dezembro de 2019. Foi a segunda metodologia mais
custosa em termos de processamento para a construção de uma única carteira, enquanto
Kelly obteve os resultados mais rápidos, por volta de 14 segundos e a abordagem modificada
de Markowitz obteve contabilizações de até 4000 segundos de processamento.
Descrição
Citação
FRANCHI, B. O.; SATO, R. C. . Análise comparativa das metodologias de Markowitz, Kelly e Aprendizado por Reforço em Carteiras de Investimentos - uma abordagem computacional. 2020.