Processamento de linguagem natural para análise da percepção do uso de antibióticos e superbactérias no Twitter em Português

dc.contributor.advisorBerton, Lilian [UNIFESP]
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9064767888093340pt_BR
dc.contributor.authorOliveira, Pedro Leyria de [UNIFESP]
dc.contributor.authorLatteshttp://lattes.cnpq.br/0164850312628440pt_BR
dc.coverage.spatialSão José dos Campos, SPpt_BR
dc.date.accessioned2023-02-02T13:37:14Z
dc.date.available2023-02-02T13:37:14Z
dc.date.issued2023-01-10
dc.description.abstractAs redes sociais são um dos meios mais proeminentes de utilização da web por usuários no mundo todo, servindo como fontes de dados para diversas análises, incluindo investigações sobre a manifestação de doenças e utilização de medicamentos. As superbactérias têm se tornado um perigo cada vez mais sério devido a utilização indevida e indiscriminada de antibióticos, gerando espécies resistentes de bactérias difíceis de serem tratadas em pacientes. O uso do Twitter para coleta de dados em português é pouco explorado e discutido, bem como investigações em redes sociais sobre o problema das superbactérias. Diante deste cenário, este trabalho tem como objetivo realizar a coleta de dados em português do Twitter sobre o consumo de antibióticos relacionados a ocorrência de superbactérias. Os objetivos também incluem executar algoritmos de detecção de tópicos visando extrair informações sobre possíveis tendências de uso destes medicamentos, e padrões de comportamento dos usuários da rede social. Os textos coletados passaram por etapas de pré-processamento comuns em processamento de linguagem natural e os algoritmos de aprendizado de máquina utilizados foram o k-means, LDA e GSDMM. O desempenho dos algoritmos foi analisado por medidas de coerência e inspeção manual dos tópicos gerados. Os assuntos mais frequentes nos tópicos obtidos incluem menções de usuários a antibióticos, incluindo casos de uso, reclamações, uso indevido ou indiscriminado, indisponibilidade de antibióticos e resistência bacteriana. Diversos antibióticos diferentes foram observados em variados contextos, incluindo comentários sobre sintomas e sentimentos variados sobre eles. Os resultados dos tópicos gerados podem servir como uma indicação dos assuntos mais discutidos no Twitter sobre antibióticos e bactérias, indicando informações que não seriam observadas em outros contextos e mídias.pt_BR
dc.description.abstractSocial networks are one of the most prominent ways users interact with the web around the world, making this a source of data for many different kinds of analysis, including investigations into disease manifestation and medical utilization. Superbugs are becoming a more serious danger because of the indiscriminate and improper use of antibiotics, generating resistant bacteria species that are more difficult to treat in patients. Twitter’s use for data collection in Portuguese is underutilized and underappreciated, as are investigations about the superbug problem on social networks. With this in mind, the goal of this study is to collect Portuguese data from Twitter on antibiotic consumption in relation to the occurrence of resistant bacteria. The goals also include the execution of topic modeling algorithms aiming to extract information about possible use tendencies for those medicines and general behavior patterns among users of the social network. The collected texts went through some pre-processing steps known for natural language processing, and the machine learning algorithms used include k-means, LDA, and GSDMM. The performance of the algorithms was evaluated using coherence metrics and manual inspection of the generated topics. The most frequent subjects found in the topics include users’ mentions of antibiotics, including common use cases for specific symptoms, complaints about specific medicines, improper or indiscriminate use of antibiotics, unavailability of antibiotics, and bacterial antimicrobial resistance. Many different antibiotics were observed in varied contexts, including comments about symptoms and varied sentiments toward them. The results of the generated topics can be useful as an indication of the most discussed subjects on Twitter concerning antibiotics and bacteria, pointing to information that would otherwise not be seen in other contexts and media.pt_BR
dc.description.sponsorshipNão recebi financiamentopt_BR
dc.emailadvisor.customlberton@unifesp.brpt_BR
dc.format.extent113 p.pt_BR
dc.identifier.citationOLIVEIRA, Pedro Leyria de. Processamento de linguagem natural para análise da percepção do uso de antibióticos e superbactérias no Twitter em Português. Orientador: Profa. Dra. Lilian Berton. 2023. 113 p. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Insituto de Ciência e Tecnologia, Universidade Federal de São Paulo, São José dos Campos, São Paulo, 2023.pt_BR
dc.identifier.urihttps://repositorio.unifesp.br/handle/11600/66808
dc.languageporpt_BR
dc.publisherUniversidade Federal de São Paulopt_BR
dc.rightsinfo:eu-repo/semantics/restrictedAccesspt_BR
dc.subjectDetecção de tópicospt_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectSuperbactériaspt_BR
dc.subjectAntibióticospt_BR
dc.subjectTwitterpt_BR
dc.titleProcessamento de linguagem natural para análise da percepção do uso de antibióticos e superbactérias no Twitter em Portuguêspt_BR
dc.typeinfo:eu-repo/semantics/bachelorThesispt_BR
unifesp.campusInstituto de Ciência e Tecnologia (ICT)pt_BR
unifesp.graduacaoEngenharia de Computaçãopt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC (1).pdf
Tamanho:
3.42 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descrição: