PPG - Ciência da Computação

URI Permanente para esta coleção

Navegar

Submissões Recentes

Agora exibindo 1 - 5 de 85
  • Item
    Mitigando viés de gênero na tradução automática para o português
    (Universidade Federal de São Paulo, 2024-02-26) Rabonato, Ricardo Trainotti [UNIFESP]; Berton, Lilian [UNIFESP]; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/8475909935036978
    A Tradução Automática (TA) tornou-se uma ferramenta essencial na era da globalização, facilitando a comunicação e o acesso à informação em diversas línguas. No entanto, a presença de viés em modelos de TA representa um desafio significativo, especialmente em línguas menos populares como o Português. Um dos desafios está relacionado à presença de viés de gênero na tradução, em que estereótipos e desigualdades sociais podem ser inadvertidamente perpetuados. Esta pesquisa se concentra em abordar e mitigar o viés de gênero em modelos de TA do Inglês para o Português, uma área ainda pouco explorada em comparação com outros pares de línguas. O foco era desenvolver uma metodologia que preservasse a precisão das traduções, ao mesmo tempo em que promovia a equidade de gênero nos textos gerados. Para isso, a estratégia adotada foi a de aplicar técnicas de ajuste fino (fine-tuning) em um modelo de TA pré-treinado, visando otimizar os parâmetros do modelo para alcançar traduções precisas e reduzir o viés de gênero. A pesquisa desenvolveu um processo de ajuste fino focado na redução do viés, que inclui a criação de um corpus paralelo Inglês-Português equilibrado em relação à representação estereotipada / não estereotipada de gênero. Foi utilizado o modelo de TA pré-treinado MarianMT como base, o qual foi ajustado utilizando um conjunto de dados específico, visando mitigar o viés de gênero nas traduções do Inglês para o Português, sem comprometer demasiadamente a qualidade do modelo original. Os resultados, medidos com base no conjunto de testes WinoMT, determinados pelos indicadores ∆G, ∆S e a acurácia global (preservação do gênero da entidade principal do original), mostraram uma melhoria significativa na equidade de gênero após o emprego do fine-tuning, embora com uma ligeira redução na qualidade da tradução, verificada pela pontuação BLEU (BiLingual Evaluation Understudy). Este estudo não só demonstra a eficácia do fine-tuning para atenuar o viés de gênero em traduções do Inglês para o Português, mas também contribui para a compreensão mais ampla de como abordar este desafio e abre caminhos para futuras pesquisas na área, ressaltando a importância de criar sistemas de inteligência artificial mais inclusivos e eticamente responsáveis.
  • Item
    Auto-ML para manutenção industrial 4.0
    (Universidade Federal de São Paulo, 2024-02-27) Huarayo Quispe, Joel Frank [UNIFESP]; Berton, Lilian [UNIFESP]; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/3740015935039713
    A Manutenção Industrial 4.0 tem sido uma área em constante evolução, onde a utilização de técnicas de aprendizado de máquina e inteligência artificial desempenham um papel crucial para aumentar a eficiência, a previsibilidade e a confiabilidade dos processos industriais. Neste contexto, o presente trabalho tem como objetivo investigar a aplicação do AutoML (Automated Machine Learning) na otimização de processos de manutenção industrial. O AutoML é uma abordagem inovadora que permite automatizar etapas importantes do fluxo de trabalho de aprendizado de máquina, como seleção de modelos, pré-processamento de dados e ajuste de hiperparâmetros, possibilitando que profissionais com pouca experiência em ciência de dados também possam criar modelos de qualidade. Este trabalho abordou três principais aspectos relacionados ao AutoML na indústria. Em primeiro lugar, foi realizada uma revisão sistemática da literatura sobre o uso de AutoML em contextos industriais, examinando estudos relevantes nos últimos anos. Em segundo lugar, foi conduzido um comparativo entre três bibliotecas de AutoML amplamente utilizadas (H2O, Pycaret e TPOT), analisando diversos critérios como características e requisitos, integração de dados, preparação de dados, modelagem, desempenho, implantação e aplicabilidade específica para cenários industriais. Testes foram realizados considerando três datasets com problemas industriais envolvendo regressão e classificação para otimização de produção e previsão de falhas de equipamentos. Por fim, foi desenvolvido um módulo de imputação de dados personalizado para a biblioteca TPOT2, com o objetivo de lidar de forma eficaz com dados ausentes ou incompletos encontrados em ambientes industriais. Essas três abordagens em conjunto contribuíram para uma compreensão mais abrangente do uso de AutoML na indústria e para o desenvolvimento de soluções práticas e eficazes para os desafios enfrentados nesse contexto.
  • Item
    Desenvolvimento de perturbação no mecanismo de atenção e treinamento adversário virtual para aprimorar o aprendizado semissupervisionado na classificação de textos
    (Universidade Federal de São Paulo, 2023-11-27) Duarte, José Marcio [UNIFESP]; Berton, Lilian; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/9673214814425178
    O advento da Internet transformou a maneira como pessoas e empresas se relacionam e comunicam informações e tem gerado uma quantidade significativa de dados em formato de texto em linguagem natural. Os documentos textuais são dados não estruturados e uma maneira de tratá-los é com o Processamento de Linguagem Natural (PLN), que é uma subárea da Inteligência Artificial, voltada para o desenvolvimento de técnicas capazes de interpretar e processar textos computacionalmente. Algoritmos de aprendizado de máquina, em especial as redes neurais têm alcançado resultados relevantes na compreensão e análise das linguagens naturais. Uma das tarefas do PLN que é de abrangente utilidade é a classificação automática de texto. No processo de classificação de texto destaca-se a representação textual que tem sido aperfeiçoada com técnicas avançadas de redes neurais que geram uma representação distribuída das palavras considerando seus contextos, visando contribuir na performance do classificador. Neste trabalho, Foi realizado uma análise de representações de texto estática e contextual para tarefas do PLN, incluindo a desambiguação no sentido da palavra e classificação de texto. Na classificação automática a abordagem supervisionada é comumente usada, neste caso, é necessário que os dados sejam rotulados para o treinamento do modelo, porém, essa tarefa implica custos e requer um período considerável de tempo. Portanto, uma estratégia para contornar a dificuldade do processo de anotação dos dados é o aprendizado semissupervisionado, cuja abordagem requer uma pequena quantidade de dados rotulados e a maior parte dos dados não precisa ser anotado. A fim de mapear o estado da arte no uso de aprendizado semissupervisionado em classificação textual, realizou-se uma revisão sistemática e identificou-se que essa abordagem é proeminente em várias aplicações. Na classificação semissupervisionada de texto o Treinamento Adversário Virtual (TAV) apresenta-se como um método adequado para regularizar o classificador e reduzir o \textit{overfitting}. Inspirado no mecanismo de atenção e o treinamento virtual adversário para o aprendizado semissupervisionado, esta pesquisa propôs uma nova abordagem com a perturbação adversária para o mecanismo de atenção. O método proposto investigou métodos de perturbação no mecanismo de atenção para geração de exemplos adversários para serem usados no treinamento adversário virtual para regularização do modelo de classificação. Os resultados obtidos considerando quatro datasets \textit{benchmarks} (AgNews, IMDB, SST, 20News) mostram um bom desempenho do modelo com ganho de acurácia em alguns \textit{datasets} e menor tempo de processamento, superando o TAV com perturbação nas \textit{embeddings} previamente explorado na literatura.
  • Item
    Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
    (Universidade Federal de São Paulo, 2023-12-08) Torquette, Gustavo Pinto [UNIFESP]; Lorena, Ana Carolina; http://lattes.cnpq.br/3451628262694747; http://lattes.cnpq.br/6394878155964687
    A abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade.
  • Item
    Spectral analysis for anomaly detection in dynamic networks with attributes
    (Universidade Federal de São Paulo, 2023-11-10) Silva, Rodrigo Francisquini da [UNIFESP]; Nascimento, Mariá Cristina Vasconcelos; http://lattes.cnpq.br/1010810293243435; http://lattes.cnpq.br/6809565539156314
    Anomaly detection in diverse datasets is a critical area of research with applicability across a wide range of domains, from cybersecurity, such as in intrusion detection in computer networks, to the financial sector, such as in identifying fraudulent activities in credit card transactions. In scenarios where data can be represented as graphs, graph theory offers a set of metrics and methodologies that are particularly effective in capturing the complex relationships and inherent structures within the data in question. However, anomaly detection in graphs presents a series of intricate challenges that have not yet been fully resolved. One such challenge is the dynamic nature of graphs, which evolve over time, rendering static techniques inadequate. Additionally, the presence of heterogeneous attributes on the vertices and edges of the graph increases the complexity of the problem. Traditional methods often fail to adapt to these temporal and spatial changes and frequently lack the interpretability required for real-world applications. To mitigate these challenges, anomaly detection strategies employing clustering techniques have received increasing attention in the literature. These strategies have the advantage of analyzing clusters or groups of vertices, allowing for a more comprehensive and holistic understanding of the underlying graph structure. Such an approach significantly enhances the method's ability to identify not only isolated anomalies but also anomalies that may be indicative of broader structural issues within the graph. The primary objective of this thesis is to investigate and develop unsupervised strategies for anomaly detection in dynamic graphs that also possess heterogeneous attributes. The proposed strategy aims to identify both structural and contextual anomalies. For the detection of structural anomalies, the analysis focuses on the contribution of vertices to the modularity of a specific network partition. On the other hand, contextual anomalies are identified through the application of spectral operators, such as the Fourier Transform. Computational experiments and case studies using real-world datasets corroborate the efficacy of the proposed method. The results demonstrate that the approach outperforms conventional methods found in the literature in terms of both accuracy and interpretability, making it a significant contribution to the field of anomaly detection in graphs.