Navegando por Palavras-chave "Aprendizado Profundo"
Agora exibindo 1 - 6 de 6
Resultados por página
Opções de Ordenação
- ItemAcesso aberto (Open Access)Classificação automática em teste de toxicidade embrio-larval de ouriço-do-mar (echinometra lucunter) por meio de técnicas de aprendizado de máquinas(Universidade Federal de São Paulo, 2023-12-04) Robinson, Yasmin Mohamad [UNIFESP]; Choueri, Rodrigo Brasil [UNIFESP]; Pereira, André Luiz Vizine [UNIFESP]; http://lattes.cnpq.br/5977522212667911; http://lattes.cnpq.br/0408418557980214; http://lattes.cnpq.br/8129289263876571; Universidade Federal de São Paulo (UNIFESP)O teste de desenvolvimento embrio-larval de ouriço do mar é amplamente utilizado na ecotoxicologia. Apesar de nacional e internacionalmente padronizado, existe a possibilidade de variação na leitura dos resultados uma vez que esta é feita pelo elemento humano, cuja decisão de se uma larva apresenta desenvolvimento anômalo ou normal, em muitos casos, pode variar dependendo do observador. Por isso, entende-se vantajosa a criação de uma ferramenta de inteligência artificial que possa realizar, de maneira automática, a partir de imagens dos organismos após fixação ao final do tempo de exposição, a identificação, contagem e determinação dos indivíduos anômalos em uma amostra, o que por fim determina o nível de toxicidade desta amostra, diminuindo a ambiguidade e os erros de classificação na execução do teste. Para o presente trabalho, portanto, foram utilizadas redes neurais de aprendizado profundo apresentando a arquitetura de rede VGG-16 para a construção de dois modelos de classificação referentes ao teste de toxicidade embrio-larval de ouriços do mar capazes de distinguir 4 níveis de desenvolvimento larvais/embrionários diferentes da espécie Echinometra Lucunter e que contasse com a distinção de detritos. O modelo construído com 5 classes reportou uma acurácia global de predição de 83% na validação, enquanto o modelo montado com apenas as 4 classes de desenvolvimento larvais reportou uma acurácia de 86%, mostrando uma performance muito próxima à de especialistas humanos e superior a outro método de aprendizado de máquina empregado em trabalho publicado.
- ItemSomente MetadadadosConstrução de algoritmos de Machine Learning na Radiologia(Universidade Federal de São Paulo (UNIFESP), 2020-09-17) Kitamura, Felipe Campos [UNIFESP]; Abdala, Nitamar [UNIFESP]; Universidade Federal de São PauloRecent research in artificial intelligence has shown great potential to change radiology as we know it today. The tools to aid the radiological diagnosis can bring numerous benefits to the patients, radiologists and referring physicians. Despite the high expectations for this technology, the path to the creation of clinically useful and safe tools is a huge challenge that involves several aspects. In this work, we will address ethical, regulatory, technical and cultural considerations that need to be addressed to expand the scope of artificial intelligence algorithms in practice. Next, we present 7 projects developed by our group that address some of the challenges in the area: (1) the lack of reproducibility when reading exams, (2) the creation of optimized algorithms for each clinical problem, (3) the limitation to access large volumes of quality annotated data, (4) the lack of reproducibility of artificial intelligence researches, (5) the difficulty of integrating algorithms in medical practice, (6) errors in the registration of exams types and (7) the risk of exposure of sensitive patient information.
- ItemSomente MetadadadosExplorando informação temporal em aprendizado profundo: reconhecimento de ações em vídeos(Universidade Federal de São Paulo (UNIFESP), 2019-08-09) Santos, Samuel Felipe Dos [UNIFESP]; Almeida Junior, Jurandy Gomes De [UNIFESP]; Universidade Federal de São Paulo (UNIFESP)The human action recognition in videos has been a very prominent task in recent years for being challenging and having applications in a wide range of areas, such as surveillance, robotics, health, video search, human-computer interaction, among others. Recently, many works have used deep learning to deal with several problems in computer vision, such as classification, retrieval, segmentation, and pattern recognition in videos. However, one of the main limitations faced by these works is their lack of capacity to learn temporal dynamics due to the large amount of data present in a video, which generates a high computational cost since it is necessary to process a huge amount of data to train a model. Although videos contain a lot of information, they also have a lot of redundancy, which makes it difficult to extract relevant information. To overcome these problems, this work propose a Compressed Video Convolutional 3D network (CV-C3D), which explores information from compressed video, avoiding the high computational cost for fully decoding the video stream. The speed up in data computation enables our network to use 3D convolutions for capturing the temporal context efficiently. The results obtained with the proposed method were evaluated in two public datasets for human action recognition, UCF-101 and HMDB- 51, where our network presented the lowest computational complexity among all the compared methods and maintained comparable performance.
- ItemAcesso aberto (Open Access)Métodos de resolução de problemas de quebra-cabeça visual baseados em aprendizado profundo(Universidade Federal de São Paulo, 2023-12-12) Taciano, Miguel Silva [UNIFESP]; Faria, Fabio [UNIFESP]; http://lattes.cnpq.br/3828728429230356; http://lattes.cnpq.br/3494257311247402The traditional Jigsaw Puzzle is a challenging task performed by humans, mainly due to its hardness and being proven to be an NP-Complete problem. Even so, recent efforts show better performance in this task using different methods involving complex computer vision and machine learning techniques. In this sense, this thesis proposes new methods based on the use of semantic segmentation (SS) and deep learning, alone and combined, with the tasked objective to solve jigsaw puzzles (visual puzzles) in different training scenarios, both with a known middle and an unknown middle configuration. To the best of our knowledge, this is the first work in the literature that uses SS for the target application. In the performed experiments, it was possible to demonstrate that our proposed methods successfully obtained excellent results when compared with other methods existing in the literature for 3 × 3 puzzle-solving tasks.
- ItemAcesso aberto (Open Access)Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.(Universidade Federal de São Paulo, 2022-08-19) Buris, Luiz Henrique [UNIFESP]; Faria, Fabio Augusto [UNIFESP]; http://lattes.cnpq.br/3828728429230356; http://lattes.cnpq.br/1837287108723885As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.
- ItemAcesso aberto (Open Access)Viabilidade do uso de inteligência artificial em fotografias de radiografias de tórax para o diagnóstico de pneumonia(Universidade Federal de São Paulo, 2021-08-11) Arasaki, Henry Koiti [UNIFESP]; Abdala, Nitamar [UNIFESP]; Kitamura, Felipe Campos [UNIFESP]; http://lattes.cnpq.br/4182930697551763; http://lattes.cnpq.br/8132921767941082Pneumonia tem sido a principal causa de morte em crianças com menos de 5 anos por décadas. O diagnóstico precoce é essencial para diminuir o risco e permitir um tratamento rápido e eficiente. Uma aplicação web que utilize aprendizado de máquina para auxiliar no diagnóstico de pneumonia a partir de fotografias de radiografias de tórax poderia salvar muitas vidas, porém realizar inferências em fotografias ao invés da imagem original pode causar um pior desempenho do modelo. Neste trabalho foram realizados testes de desempenho em um modelo com uma base VGG19 pré-treinada. A partir dos resultados foi possível observar que utilizar as imagens originais garantem uma acurácia melhor.