Detecção automática de discurso de ódio em redes sociais

dc.contributor.advisorBerton, Lilian
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9064767888093340pt_BR
dc.contributor.authorde Almeida, Maíra
dc.contributor.authorLatteshttp://lattes.cnpq.br/2317906488741286pt_BR
dc.coverage.spatialSão José dos Campospt_BR
dc.date.accessioned2021-03-25T20:18:40Z
dc.date.available2021-03-25T20:18:40Z
dc.date.issued2020-10-07
dc.description.abstractAs redes sociais trouxeram uma mudança de paradigma em relação à maneira que as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se que poucas contribuições científicas têm sido feitas para contra-atacar este problema em línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem de palavras. Este método obteve um F1-score de 0.94.pt_BR
dc.description.sponsorshipNão recebi financiamentopt_BR
dc.format.extent66 fpt_BR
dc.identifier.citationDE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo.pt_BR
dc.identifier.urihttps://repositorio.unifesp.br/handle/11600/60754
dc.languageporpt_BR
dc.publisherUniversidade Federal de São Paulopt_BR
dc.rightsAcesso abertopt_BR
dc.subjectClassificação automáticapt_BR
dc.subjectAprendizado de máquina.pt_BR
dc.subjectProcessamento de textopt_BR
dc.subjectDiscurso de ódiopt_BR
dc.titleDetecção automática de discurso de ódio em redes sociaispt_BR
dc.typeTrabalho de conclusão de curso de graduaçãopt_BR
unifesp.assessoresproreitoriasPró-reitoria de Graduaçãopt_BR
unifesp.campusInstituto de Ciência e Tecnologia (ICT)pt_BR
unifesp.departamentoNão se aplicapt_BR
unifesp.especializacaoNão se aplicapt_BR
unifesp.graduacaoEngenharia de Computaçãopt_BR
unifesp.graduateProgramNão se aplicapt_BR
unifesp.knowledgeAreaOutrapt_BR
unifesp.researchAreaProcessamento de Linguagem Natural, Aprendizado de Máquinapt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC___Final_corrigido_com _ficha.pdf
Tamanho:
2.27 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 3 de 3
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
5.31 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Carregando...
Imagem de Miniatura
Nome:
Termo Autorização_Alterado(1) (1).pdf
Tamanho:
131.32 KB
Formato:
Adobe Portable Document Format
Descrição:
Carregando...
Imagem de Miniatura
Nome:
Termo_de_Responsabilidade_e_Autencidade_TCC_Unifesp_Portaria_Prograd._n._3-2021 (1)(1).pdf
Tamanho:
103.23 KB
Formato:
Adobe Portable Document Format
Descrição: