Detecção automática de discurso de ódio em redes sociais
Nenhuma Miniatura disponível
Data
2020-10-07
Autores
de Almeida, Maíra
Orientadores
Berton, Lilian
Tipo
Trabalho de conclusão de curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Resumo
As redes sociais trouxeram uma mudança de paradigma em relação à maneira que
as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento
de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque
um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um
certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se
que poucas contribuições científicas têm sido feitas para contra-atacar este problema em
línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso
de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de
dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as
principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de
TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem
de palavras. Este método obteve um F1-score de 0.94.
Descrição
Citação
DE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo.