Detecção automática de discurso de ódio em redes sociais

Nenhuma Miniatura disponível
Data
2020-10-07
Autores
de Almeida, Maíra
Orientadores
Berton, Lilian
Tipo
Trabalho de conclusão de curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Resumo
As redes sociais trouxeram uma mudança de paradigma em relação à maneira que as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se que poucas contribuições científicas têm sido feitas para contra-atacar este problema em línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem de palavras. Este método obteve um F1-score de 0.94.
Descrição
Citação
DE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo.