Detecção automática de discurso de ódio em redes sociais

de Almeida, Maíra

Detecção automática de discurso de ódio em redes sociais

Arquivos

TCC___Final_corrigido_com _ficha.pdf(2.27 MB)

Data

2020-10-07

Autores

de Almeida, Maíra

Orientadores

Berton, Lilian

Tipo

Trabalho de conclusão de curso

Resumo

As redes sociais trouxeram uma mudança de paradigma em relação à maneira que as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se que poucas contribuições científicas têm sido feitas para contra-atacar este problema em línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem de palavras. Este método obteve um F1-score de 0.94.

Citação

DE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo.