Detecção automática de discurso de ódio em redes sociais
dc.contributor.advisor | Berton, Lilian | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9064767888093340 | pt_BR |
dc.contributor.author | de Almeida, Maíra | |
dc.contributor.authorLattes | http://lattes.cnpq.br/2317906488741286 | pt_BR |
dc.coverage.spatial | São José dos Campos | pt_BR |
dc.date.accessioned | 2021-03-25T20:18:40Z | |
dc.date.available | 2021-03-25T20:18:40Z | |
dc.date.issued | 2020-10-07 | |
dc.description.abstract | As redes sociais trouxeram uma mudança de paradigma em relação à maneira que as pessoas se comunicam. Elas permitem que usuários expressem suas opiniões “livremente”, sem nenhum tipo de contato humano direto. Isso abre brechas para o surgimento de discurso de ódio na internet. Discurso de ódio se refere a qualquer comentário que ataque um indivíduo/grupo com relação a sua raça, gênero, etnia, nacionalidade, religião, orientação sexual ou outro aspecto passível de discriminação. Em redes sociais que permitem um certo grau de anonimidade, como o Twitter, este problema pode ser exacerbado. Notou-se que poucas contribuições científicas têm sido feitas para contra-atacar este problema em línguas diferentes do inglês. Este trabalho tem como objetivo empregar técnicas de processamento de texto e aprendizado de máquina para fazer a classificação de dados de discurso de ódio. Objetivou-se explorar diferentes algoritmos de classificação em um conjunto de dados formado por tweets em português. Os resultados foram avaliados por meio de métricas estatísticas, e através delas, foram feitas comparações entre os resultados obtidos e as principais abordagens consideradas como estado-da-arte. O método obtido foi uma combinação do classificador Support Vector Machines, com vetorização através da técnica de TF-IDF. Além das técnicas de pré-processamento e vetorização, quatro novas características foram geradas para cada exemplo do conjunto de dados, tendo como base, a contagem de palavras. Este método obteve um F1-score de 0.94. | pt_BR |
dc.description.sponsorship | Não recebi financiamento | pt_BR |
dc.format.extent | 66 f | pt_BR |
dc.identifier.citation | DE ALMEIDA, M. e BERTON, L., 2020. Detecção Automática de Discurso de Ódio em Redes Sociais. Trabalho de Conclusão de Curso. Universidade Federal de São Paulo. | pt_BR |
dc.identifier.uri | https://repositorio.unifesp.br/handle/11600/60754 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de São Paulo | pt_BR |
dc.rights | info:eu-repo/semantics/openAccess | pt_BR |
dc.subject | Classificação automática | pt_BR |
dc.subject | Aprendizado de máquina. | pt_BR |
dc.subject | Processamento de texto | pt_BR |
dc.subject | Discurso de ódio | pt_BR |
dc.title | Detecção automática de discurso de ódio em redes sociais | pt_BR |
dc.type | info:eu-repo/semantics/bachelorThesis | pt_BR |
unifesp.assessoresproreitorias | Pró-reitoria de Graduação | pt_BR |
unifesp.campus | Instituto de Ciência e Tecnologia (ICT) | pt_BR |
unifesp.departamento | Não se aplica | pt_BR |
unifesp.especializacao | Não se aplica | pt_BR |
unifesp.graduacao | Engenharia de Computação | pt_BR |
unifesp.graduateProgram | Não se aplica | pt_BR |
unifesp.knowledgeArea | Outra | pt_BR |
unifesp.researchArea | Processamento de Linguagem Natural, Aprendizado de Máquina | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCC___Final_corrigido_com _ficha.pdf
- Tamanho:
- 2.27 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 3 de 3
Carregando...
- Nome:
- license.txt
- Tamanho:
- 5.31 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Carregando...
- Nome:
- Termo Autorização_Alterado(1) (1).pdf
- Tamanho:
- 131.32 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
Carregando...
- Nome:
- Termo_de_Responsabilidade_e_Autencidade_TCC_Unifesp_Portaria_Prograd._n._3-2021 (1)(1).pdf
- Tamanho:
- 103.23 KB
- Formato:
- Adobe Portable Document Format
- Descrição: