Processamento de linguagem natural para análise da percepção do uso de antibióticos e superbactérias no Twitter em Português

Data
2023-01-10
Tipo
Trabalho de conclusão de curso
Título da Revista
ISSN da Revista
Título de Volume
Resumo
As redes sociais são um dos meios mais proeminentes de utilização da web por usuários no mundo todo, servindo como fontes de dados para diversas análises, incluindo investigações sobre a manifestação de doenças e utilização de medicamentos. As superbactérias têm se tornado um perigo cada vez mais sério devido a utilização indevida e indiscriminada de antibióticos, gerando espécies resistentes de bactérias difíceis de serem tratadas em pacientes. O uso do Twitter para coleta de dados em português é pouco explorado e discutido, bem como investigações em redes sociais sobre o problema das superbactérias. Diante deste cenário, este trabalho tem como objetivo realizar a coleta de dados em português do Twitter sobre o consumo de antibióticos relacionados a ocorrência de superbactérias. Os objetivos também incluem executar algoritmos de detecção de tópicos visando extrair informações sobre possíveis tendências de uso destes medicamentos, e padrões de comportamento dos usuários da rede social. Os textos coletados passaram por etapas de pré-processamento comuns em processamento de linguagem natural e os algoritmos de aprendizado de máquina utilizados foram o k-means, LDA e GSDMM. O desempenho dos algoritmos foi analisado por medidas de coerência e inspeção manual dos tópicos gerados. Os assuntos mais frequentes nos tópicos obtidos incluem menções de usuários a antibióticos, incluindo casos de uso, reclamações, uso indevido ou indiscriminado, indisponibilidade de antibióticos e resistência bacteriana. Diversos antibióticos diferentes foram observados em variados contextos, incluindo comentários sobre sintomas e sentimentos variados sobre eles. Os resultados dos tópicos gerados podem servir como uma indicação dos assuntos mais discutidos no Twitter sobre antibióticos e bactérias, indicando informações que não seriam observadas em outros contextos e mídias.
Social networks are one of the most prominent ways users interact with the web around the world, making this a source of data for many different kinds of analysis, including investigations into disease manifestation and medical utilization. Superbugs are becoming a more serious danger because of the indiscriminate and improper use of antibiotics, generating resistant bacteria species that are more difficult to treat in patients. Twitter’s use for data collection in Portuguese is underutilized and underappreciated, as are investigations about the superbug problem on social networks. With this in mind, the goal of this study is to collect Portuguese data from Twitter on antibiotic consumption in relation to the occurrence of resistant bacteria. The goals also include the execution of topic modeling algorithms aiming to extract information about possible use tendencies for those medicines and general behavior patterns among users of the social network. The collected texts went through some pre-processing steps known for natural language processing, and the machine learning algorithms used include k-means, LDA, and GSDMM. The performance of the algorithms was evaluated using coherence metrics and manual inspection of the generated topics. The most frequent subjects found in the topics include users’ mentions of antibiotics, including common use cases for specific symptoms, complaints about specific medicines, improper or indiscriminate use of antibiotics, unavailability of antibiotics, and bacterial antimicrobial resistance. Many different antibiotics were observed in varied contexts, including comments about symptoms and varied sentiments toward them. The results of the generated topics can be useful as an indication of the most discussed subjects on Twitter concerning antibiotics and bacteria, pointing to information that would otherwise not be seen in other contexts and media.
Descrição
Citação
OLIVEIRA, Pedro Leyria de. Processamento de linguagem natural para análise da percepção do uso de antibióticos e superbactérias no Twitter em Português. Orientador: Profa. Dra. Lilian Berton. 2023. 113 p. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Insituto de Ciência e Tecnologia, Universidade Federal de São Paulo, São José dos Campos, São Paulo, 2023.
Pré-visualização PDF(s)