Aplicação de algoritmos não supervisionados em dados eleitorais

dc.audience.educationlevelMestrado
dc.contributor.advisorBueno, Luis Felipe Cesar Da Rocha [UNIFESP]
dc.contributor.authorPolizeli, Mateus Vendramini [UNIFESP]
dc.contributor.institutionUniversidade Federal de São Paulo (UNIFESP)pt
dc.date.accessioned2021-01-19T16:36:38Z
dc.date.available2021-01-19T16:36:38Z
dc.date.issued2019-12-03
dc.description.abstractGiven the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.en
dc.description.abstractDiante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.pt
dc.description.sourceDados abertos - Sucupira - Teses e dissertações (2019)
dc.identifierhttps://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459pt
dc.identifier.fileMATEUS VENDRAMINI POLIZELI.pdf
dc.identifier.urihttps://repositorio.unifesp.br/handle/11600/59852
dc.language.isopor
dc.publisherUniversidade Federal de São Paulo (UNIFESP)
dc.rightsAcesso aberto
dc.subjectAnomaly Detectionen
dc.subjectOutliersen
dc.subjectElectoral Dataen
dc.subjectIsolation Foresten
dc.subjectK-Means.en
dc.subjectDetecção De Anomaliaspt
dc.subjectOutlierspt
dc.subjectDados Eleitoraispt
dc.subjectIsolation Forestpt
dc.subjectK-Meanspt
dc.titleAplicação de algoritmos não supervisionados em dados eleitoraispt
dc.typeDissertação de mestrado
unifesp.campusSão José dos Campos, Instituto de Ciência e Tecnologiapt
unifesp.graduateProgramPesquisa Operacionalpt
unifesp.knowledgeAreaPesquisa Operacionalpt
unifesp.researchAreaMétodos De Otimizaçãopt
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
MATEUS VENDRAMINI POLIZELI.pdf
Tamanho:
2.4 MB
Formato:
Adobe Portable Document Format
Descrição: