Aplicação de algoritmos não supervisionados em dados eleitorais

Nenhuma Miniatura disponível
Data
2019-12-03
Autores
Polizeli, Mateus Vendramini [UNIFESP]
Orientadores
Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]
Tipo
Dissertação de mestrado
Título da Revista
ISSN da Revista
Título de Volume
Resumo
Given the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.
Diante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.
Descrição
Citação