PPG - Ciência da Computação
URI Permanente para esta coleção
Navegar
Submissões Recentes
- ItemAcesso aberto (Open Access)Enhancing artificial neural networks for smarter applications on low-cost resource-constrained microcontrollers(Universidade Federal de São Paulo, 2024-03-21) Nascimento, Alexandre [UNIFESP]; Basgalupp, Márcio [UNIFESP]; Melo, Vinicius; http://lattes.cnpq.br/5205741481605855; http://lattes.cnpq.br/4922142296922435A convergência da Inteligência Artificial (IA) com a Internet das Coisas (IoT), AIoT, torna os dispositivos mais capazes em áreas como saúde, cidades inteligentes e agricultura, desempenhando um papel crucial na promoção de práticas sustentáveis e na melhoria dos esforços de conservação ambiental. No entanto, a incorporação da IA em nós computacionais de borda da IoT apresenta desafios, como a necessidade de microcontroladores superiores, que aumentam os custos e impedem soluções em larga escala. Esta tese propõe novas abordagens para lidar com três lacunas principais no uso de redes neurais artificiais (ANN, do inglês Artificial Neural Networks) em dispositivos de borda baseados em microcontroladores de baixo custo. A primeira lacuna é que as estratégias existentes para executar ANN em dispositivos de borda frequentemente resultam em acurácia reduzida e ainda exigem microcontroladores poderosos. A segunda lacuna é que os grandes conjuntos de dados necessários para treinar ANN aumentam o custo de retreino e tornam qualquer iniciativa de retreino em dispositivos de borda inviável. Finalmente, a execução de aplicacões utilizando ANN em dispositivos de borda é limitada devido à sua capacidade computacional restrita. Para abordar essas lacunas, esta tese propõe novas estratégias de treino e sintonia fina de ANN para melhorar a precisão de pequenas ANNs. As estratégias de treino propostas se baseiam na troca de otimizadores de treinamento e de pequenos sub conjuntos de dados derivados do conjunto original. Com isso, se foi possível alcançar qualidade semelhante à obtida com conjuto de dados maiores, mas utilizando conjuntos de dados menores. Por exemplo, em um experimento, foi possível atingir 80% de acurácia com apenas 52% dos dados utilizados num treino convencional. Além disso, propõe-se uma técnica para fazer a sintonia fina da ANN e adaptá-la à ANN para executar em microcontroladores de baixo-custo (ex: 8 bits), permitindo desempenho às vezes superior em comparação com benchmarks em processadores mais poderosos. Neste trabalho, um total de 16 hipóteses foram formuladas e, para testá-las, um total de 7,392,380 ANNs foram treinadas e avaliadas em 9 datasets distintos. Os resultados contribuem para o desenvolvimento de ANNs mais leves e melhores para dispositivos de borda menos poderosos, bem como criam uma agenda de pesquisa sobre a mistura de otimizadores para o treinamento de ANNs. Este trabalho estabelece o primeiro benchmark de IA para microcontroladores de 8 bits compatíveis com a plataforma Arduino.
- ItemAcesso aberto (Open Access)Heurísticas de usabilidade para aplicações imersivas de treinamento na Indústria 4.0(Universidade Federal de São Paulo, 2024-05-07) Andrade, Daniel Martins [UNIFESP]; Silva, Tiago Silva da [UNIFESP]; http://lattes.cnpq.br/3705063712805065; http://lattes.cnpq.br/9062238878020117O surgimento do termo ``Indústria 4.0'' em 2011 marcou o início da considerada quarta Revolução Industrial, impulsionando estudos para a implementação das tecnologias associadas, como Realidade Virtual, Realidade Aumentada e Realidade Misturada. É notável que o setor de treinamento industrial tem emergido como um pioneiro nessa nova era, destacando-se por ser o mais avançado na adoção dessas tecnologias inovadoras. No entanto, as interações com essas tecnologias têm sido desafiadoras, devido à falta de compreensão em Design e Experiência do Usuário, levando a complicações na implementação efetiva, altos custos e incertezas quanto à sua eficácia. Diante disso, o objetivo geral do estudo foi propor e validar um conjunto de heurísticas de usabilidade específicas para aplicações imersivas de treinamento na Indústria 4.0, com a intenção de aprimorar a usabilidade dessas aplicações. Para isso, foi adotado um método robusto, tanto para formulação quanto para validação das heurísticas. A metodologia abrange oito etapas estabelecidas exclusivamente para orientar a criação de heurísticas de usabilidade voltadas a domínios específicos. Os resultados obtidos indicaram que o novo conjunto de heurísticas desenvolvido foi melhor em comparação com heurísticas gerais de avaliação de usabilidade. As heurísticas propostas demonstraram eficácia ao identificar problemas dentro dos parâmetros de validação adotados na metodologia, abrangendo tanto questões específicas do contexto quanto problemas mais críticos e graves. No entanto, é importante destacar que, apesar das contribuições significativas, limitações como o tamanho da amostra de avaliadores e a ausência de heurísticas específicas na literatura foram identificadas. Em conclusão, a pesquisa enfatiza o potencial de enriquecer a experiência do usuário e facilitar a adoção bem-sucedida de aplicações imersivas de treinamento na indústria 4.0. Para avanços futuros, é recomendada a ampliação da amostra de avaliadores, a inclusão de usuários reais e uma análise da literatura cinza, para um estudo ainda mais abrangente da usabilidade e experiência do usuário nesse contexto.
- ItemAcesso aberto (Open Access)Mitigando viés de gênero na tradução automática para o português(Universidade Federal de São Paulo, 2024-02-26) Rabonato, Ricardo Trainotti [UNIFESP]; Berton, Lilian [UNIFESP]; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/8475909935036978A Tradução Automática (TA) tornou-se uma ferramenta essencial na era da globalização, facilitando a comunicação e o acesso à informação em diversas línguas. No entanto, a presença de viés em modelos de TA representa um desafio significativo, especialmente em línguas menos populares como o Português. Um dos desafios está relacionado à presença de viés de gênero na tradução, em que estereótipos e desigualdades sociais podem ser inadvertidamente perpetuados. Esta pesquisa se concentra em abordar e mitigar o viés de gênero em modelos de TA do Inglês para o Português, uma área ainda pouco explorada em comparação com outros pares de línguas. O foco era desenvolver uma metodologia que preservasse a precisão das traduções, ao mesmo tempo em que promovia a equidade de gênero nos textos gerados. Para isso, a estratégia adotada foi a de aplicar técnicas de ajuste fino (fine-tuning) em um modelo de TA pré-treinado, visando otimizar os parâmetros do modelo para alcançar traduções precisas e reduzir o viés de gênero. A pesquisa desenvolveu um processo de ajuste fino focado na redução do viés, que inclui a criação de um corpus paralelo Inglês-Português equilibrado em relação à representação estereotipada / não estereotipada de gênero. Foi utilizado o modelo de TA pré-treinado MarianMT como base, o qual foi ajustado utilizando um conjunto de dados específico, visando mitigar o viés de gênero nas traduções do Inglês para o Português, sem comprometer demasiadamente a qualidade do modelo original. Os resultados, medidos com base no conjunto de testes WinoMT, determinados pelos indicadores ∆G, ∆S e a acurácia global (preservação do gênero da entidade principal do original), mostraram uma melhoria significativa na equidade de gênero após o emprego do fine-tuning, embora com uma ligeira redução na qualidade da tradução, verificada pela pontuação BLEU (BiLingual Evaluation Understudy). Este estudo não só demonstra a eficácia do fine-tuning para atenuar o viés de gênero em traduções do Inglês para o Português, mas também contribui para a compreensão mais ampla de como abordar este desafio e abre caminhos para futuras pesquisas na área, ressaltando a importância de criar sistemas de inteligência artificial mais inclusivos e eticamente responsáveis.
- ItemAcesso aberto (Open Access)Auto-ML para manutenção industrial 4.0(Universidade Federal de São Paulo, 2024-02-27) Huarayo Quispe, Joel Frank [UNIFESP]; Berton, Lilian [UNIFESP]; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/3740015935039713A Manutenção Industrial 4.0 tem sido uma área em constante evolução, onde a utilização de técnicas de aprendizado de máquina e inteligência artificial desempenham um papel crucial para aumentar a eficiência, a previsibilidade e a confiabilidade dos processos industriais. Neste contexto, o presente trabalho tem como objetivo investigar a aplicação do AutoML (Automated Machine Learning) na otimização de processos de manutenção industrial. O AutoML é uma abordagem inovadora que permite automatizar etapas importantes do fluxo de trabalho de aprendizado de máquina, como seleção de modelos, pré-processamento de dados e ajuste de hiperparâmetros, possibilitando que profissionais com pouca experiência em ciência de dados também possam criar modelos de qualidade. Este trabalho abordou três principais aspectos relacionados ao AutoML na indústria. Em primeiro lugar, foi realizada uma revisão sistemática da literatura sobre o uso de AutoML em contextos industriais, examinando estudos relevantes nos últimos anos. Em segundo lugar, foi conduzido um comparativo entre três bibliotecas de AutoML amplamente utilizadas (H2O, Pycaret e TPOT), analisando diversos critérios como características e requisitos, integração de dados, preparação de dados, modelagem, desempenho, implantação e aplicabilidade específica para cenários industriais. Testes foram realizados considerando três datasets com problemas industriais envolvendo regressão e classificação para otimização de produção e previsão de falhas de equipamentos. Por fim, foi desenvolvido um módulo de imputação de dados personalizado para a biblioteca TPOT2, com o objetivo de lidar de forma eficaz com dados ausentes ou incompletos encontrados em ambientes industriais. Essas três abordagens em conjunto contribuíram para uma compreensão mais abrangente do uso de AutoML na indústria e para o desenvolvimento de soluções práticas e eficazes para os desafios enfrentados nesse contexto.
- ItemAcesso aberto (Open Access)Desenvolvimento de perturbação no mecanismo de atenção e treinamento adversário virtual para aprimorar o aprendizado semissupervisionado na classificação de textos(Universidade Federal de São Paulo, 2023-11-27) Duarte, José Marcio [UNIFESP]; Berton, Lilian; http://lattes.cnpq.br/9064767888093340; http://lattes.cnpq.br/9673214814425178O advento da Internet transformou a maneira como pessoas e empresas se relacionam e comunicam informações e tem gerado uma quantidade significativa de dados em formato de texto em linguagem natural. Os documentos textuais são dados não estruturados e uma maneira de tratá-los é com o Processamento de Linguagem Natural (PLN), que é uma subárea da Inteligência Artificial, voltada para o desenvolvimento de técnicas capazes de interpretar e processar textos computacionalmente. Algoritmos de aprendizado de máquina, em especial as redes neurais têm alcançado resultados relevantes na compreensão e análise das linguagens naturais. Uma das tarefas do PLN que é de abrangente utilidade é a classificação automática de texto. No processo de classificação de texto destaca-se a representação textual que tem sido aperfeiçoada com técnicas avançadas de redes neurais que geram uma representação distribuída das palavras considerando seus contextos, visando contribuir na performance do classificador. Neste trabalho, Foi realizado uma análise de representações de texto estática e contextual para tarefas do PLN, incluindo a desambiguação no sentido da palavra e classificação de texto. Na classificação automática a abordagem supervisionada é comumente usada, neste caso, é necessário que os dados sejam rotulados para o treinamento do modelo, porém, essa tarefa implica custos e requer um período considerável de tempo. Portanto, uma estratégia para contornar a dificuldade do processo de anotação dos dados é o aprendizado semissupervisionado, cuja abordagem requer uma pequena quantidade de dados rotulados e a maior parte dos dados não precisa ser anotado. A fim de mapear o estado da arte no uso de aprendizado semissupervisionado em classificação textual, realizou-se uma revisão sistemática e identificou-se que essa abordagem é proeminente em várias aplicações. Na classificação semissupervisionada de texto o Treinamento Adversário Virtual (TAV) apresenta-se como um método adequado para regularizar o classificador e reduzir o \textit{overfitting}. Inspirado no mecanismo de atenção e o treinamento virtual adversário para o aprendizado semissupervisionado, esta pesquisa propôs uma nova abordagem com a perturbação adversária para o mecanismo de atenção. O método proposto investigou métodos de perturbação no mecanismo de atenção para geração de exemplos adversários para serem usados no treinamento adversário virtual para regularização do modelo de classificação. Os resultados obtidos considerando quatro datasets \textit{benchmarks} (AgNews, IMDB, SST, 20News) mostram um bom desempenho do modelo com ganho de acurácia em alguns \textit{datasets} e menor tempo de processamento, superando o TAV com perturbação nas \textit{embeddings} previamente explorado na literatura.