Detecção automática de discurso de ódio em redes sociais
Data
2020-10-07
Tipo
Trabalho de conclusão de curso
Título da Revista
ISSN da Revista
Título de Volume
Resumo
As redes sociais trouxeram uma mudança de paradigma em relação à maneira que
as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento
de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque
um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um
certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se
que poucas contribuições científicas têm sido feitas para contra-atacar este problema em
línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso
de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de
dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as
principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de
TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem
de palavras. Este método obteve um F1-score de 0.94.
Descrição
Citação
DE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo.