Navegando por Palavras-chave "Classificação de texto"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
- ItemAcesso aberto (Open Access)Análise de sentimentos dos usuários do Twitter sobre a eleição presidencial de 2022 no Brasil(Universidade Federal de São Paulo, 2023-01-20) Santos, Daiana Kathrin Santana [UNIFESP]; Berton, Lilian; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/1892442193378694O crescimento da internet e da comunicação por meio das redes sociais, facilitou a obtenção de informações sobre o que outros indivíduos estão pensando e qual a opinião deles para determinado assunto, porém, uma pessoa manualmente não consegue analisar todos os comentários na rede sobre certo tema, sendo necessário o uso de tecnologias, computadores e algoritmos para auxiliar na análise dos dados. Diante disso, este trabalho tem o objetivo de coletar, processar e classificar os sentimentos de uma amostra de textos publicados no Twitter, em Português, sobre as eleições presidenciais no Brasil em 2022, utilizando o processo de Descoberta de Conhecimento em Base de Dados para analisar os comentários e conseguir classificar os tweets entre opiniões positivas, neutras e negativas. Desse modo, predizer qual candidato tem uma maior aceitação/rejeição por parte dos brasileiros nas eleições de 2022, considerando apenas os candidatos com melhores posições nas pesquisas de intenção de votos. De acordo com os resultados obtidos empregando um dataset balanceado no treinamento dos algoritmos, o candidato com maior porcentagem de sentimentos positivos foi Jair Bolsonaro, sentimentos neutros foi Luiz Inácio Lula da Silva e sentimentos negativos foi Ciro Gomes.
- ItemAcesso aberto (Open Access)Desenvolvimento de perturbação no mecanismo de atenção e treinamento adversário virtual para aprimorar o aprendizado semissupervisionado na classificação de textos(Universidade Federal de São Paulo, 2023-11-27) Duarte, José Marcio [UNIFESP]; Berton, Lilian; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/9673214814425178O advento da Internet transformou a maneira como pessoas e empresas se relacionam e comunicam informações e tem gerado uma quantidade significativa de dados em formato de texto em linguagem natural. Os documentos textuais são dados não estruturados e uma maneira de tratá-los é com o Processamento de Linguagem Natural (PLN), que é uma subárea da Inteligência Artificial, voltada para o desenvolvimento de técnicas capazes de interpretar e processar textos computacionalmente. Algoritmos de aprendizado de máquina, em especial as redes neurais têm alcançado resultados relevantes na compreensão e análise das linguagens naturais. Uma das tarefas do PLN que é de abrangente utilidade é a classificação automática de texto. No processo de classificação de texto destaca-se a representação textual que tem sido aperfeiçoada com técnicas avançadas de redes neurais que geram uma representação distribuída das palavras considerando seus contextos, visando contribuir na performance do classificador. Neste trabalho, Foi realizado uma análise de representações de texto estática e contextual para tarefas do PLN, incluindo a desambiguação no sentido da palavra e classificação de texto. Na classificação automática a abordagem supervisionada é comumente usada, neste caso, é necessário que os dados sejam rotulados para o treinamento do modelo, porém, essa tarefa implica custos e requer um período considerável de tempo. Portanto, uma estratégia para contornar a dificuldade do processo de anotação dos dados é o aprendizado semissupervisionado, cuja abordagem requer uma pequena quantidade de dados rotulados e a maior parte dos dados não precisa ser anotado. A fim de mapear o estado da arte no uso de aprendizado semissupervisionado em classificação textual, realizou-se uma revisão sistemática e identificou-se que essa abordagem é proeminente em várias aplicações. Na classificação semissupervisionada de texto o Treinamento Adversário Virtual (TAV) apresenta-se como um método adequado para regularizar o classificador e reduzir o \textit{overfitting}. Inspirado no mecanismo de atenção e o treinamento virtual adversário para o aprendizado semissupervisionado, esta pesquisa propôs uma nova abordagem com a perturbação adversária para o mecanismo de atenção. O método proposto investigou métodos de perturbação no mecanismo de atenção para geração de exemplos adversários para serem usados no treinamento adversário virtual para regularização do modelo de classificação. Os resultados obtidos considerando quatro datasets \textit{benchmarks} (AgNews, IMDB, SST, 20News) mostram um bom desempenho do modelo com ganho de acurácia em alguns \textit{datasets} e menor tempo de processamento, superando o TAV com perturbação nas \textit{embeddings} previamente explorado na literatura.