PPG - Ciência da Computação
URI Permanente para esta coleção
Navegar
Navegando PPG - Ciência da Computação por Orientador(es) "Faria, Fabio Augusto [UNIFESP]"
Agora exibindo 1 - 4 de 4
Resultados por página
Opções de Ordenação
- ItemSomente MetadadadosUm arcabouço para seleção e combinação de classificadores baseado em algoritmos evolutivos(Universidade Federal de São Paulo (UNIFESP), 2019-11-29) Ferreira Junior, Alvaro Roberto [UNIFESP]; Faria, Fabio Augusto [UNIFESP]; Universidade Federal de São Paulo (UNIFESP)Classification is one of the most studied learning tasks in the area of machine learning and aims to find a hypothesis (model) that best fits and generalizes the behavior of data during the training stage. Once the classification model has been learned, it will assign classes to new examples in the test phase. In the literature, many studies have been carried out to solve classification problems in several knowledge domains (e.g., medicine, biology, safety and remote sensing). As there is not a single classifier that achieves satisfactory results in any application, a good alternative is to adopt information fusion strategies. Among the information fusion strategies are those related to the combination of classifiers or the so-called multiple classifier systems (MCSs). An MCS aims to combine classifiers that have complementary information to each other to improve the results of effectiveness in the target application. In these systems, a very important concept for measuring the degree of agreement/disagreement among classifiers is so-called diversity. Although many authors have adopted diversity in their work, it was noted that its use alone is not sufficient to obtain improvements in the effectiveness of MCSs. An essential factor for the success of these approaches is the combination of diversity and accuracy of the classifiers belonging to the MCS. As there are infinite classifiers in the literature, a challenge lies in the choice of classifiers that will compose the final classification system, thus arising the need to develop new strategies for classifier selection. In this sense, this work proposes the development of a framework for selection and combination of classifiers that uses different optimization techniques based on evolutionary algorithms combining measures of diversity and accuracy of classifiers, selecting a subset of these classifiers based on many other classifiers available and finally, create an MCS to improve the results of effectiveness in the classification task. In the experiments carried out it was possible to analyze the impact of each of the four steps of the CIF-E protocol (Classifiers, Initialization, Fitness of individuals and Evolutionary technique) that make up the proposed framework, totaling 24 different methods implemented and tested. In addition, a comparative analysis between the best methods proposed in this work and the methods in the literature was performed. Finally, the experiments show that the method based on Univariate Marginal Distribution Algorithm (UMDA) can be better than the seven state-of-the-art literature methods in eleven of the nineteen UCI datasets tested in this work.
- ItemSomente MetadadadosA Comparative Study On Regression Approaches For Event Detection In Instagram(Universidade Federal de São Paulo (UNIFESP), 2017-11-30) Santos, Elder Donizetti Dos [UNIFESP]; Faria, Fabio Augusto [UNIFESP]; Universidade Federal de São Paulo (UNIFESP)With the advancement of the use of web-based applications and mobile device technologies, in particular, online social networks, many approaches have been proposed in the literature using it as the source of information. Online social networks like Instagram have more than 700 million users who, together, create over 300 million new content every day. All of this data can be used, for instance, to detect real-world events. Such events can be defined as a car accident, a natural disaster, a riot, a political affair, among others. In order to do that, algorithms need to manage massive, rapidly changing and fast arriving data streams made of text, images, and videos. It also involves challenges such as the lack of a labeled database to analyze the effectiveness of applied techniques that can be reused by other researchers and the need for an approach that adapts to the constant changes in the flow of information. However, existing approaches are often either limited or not suitable for new data sources like Instagram. In this sense, this work provides contributions in the area of event detection for online social networks. As a first contribution a review on how the task of event detection has been approached by researchers since its inception in the 1990’s is presented. The second contribution is an introduction to the behavior and volume characteristics of Instagram posts modeled as time series. Then, a comparative study of different regression techniques for time series prediction is conducted by applying a preprocessing step and algorithms such as Support Vector Regression (SVR), Multilayer Perceptron (MLP), Autoregressive Integrated Moving Averages (ARIMA), Classification and Regression Trees (CART) and K-Nearest Neighbors (KNN). As a result, it is demonstrated how a simple yet efficient approach can be used to detect events in social networks. Trying to overcome some of the challenges mentioned, as a third contribution, a semi-supervised learning approach is proposed using time series correlations. Experimental studies have shown that time series from different sub-regions with similar characteristics can be used to generalize knowledge and predict the occurrence of an event. Moreover, it is demonstrated that the proposed approach is a good alternative to the Gaussian Process Regression (GPR) used in the literature since the approach based on time series correlations provides good results using much less computing resources than GPR. In addition to the main contributions cited, the entire dataset used in this thesis with more than 180 thousand manually labeled Instagram posts is publicly available.
- ItemAcesso aberto (Open Access)e-NEAT: Um Arcabouço de Combinação de Classificadores baseados em Neuroevolução(Universidade Federal de São Paulo, 2023-02-28) Pimenta, Guilherme Bruno Araújo [UNIFESP]; Faria, Fabio Augusto [UNIFESP]; http://lattes.cnpq.br/3828728429230356; http://lattes.cnpq.br/2284592753469868Técnicas de aprendizado de máquina são aplicadas em diversas áreas do conhecimento, de modo a criar modelos que sejam capazes de auxiliar ou substituir tarefas realizadas por pessoas. Considerando modelos de aprendizado de máquina mais tradicionais, nota-se certa dependência desses com a presença de um especialista, que possua conhecimento tanto do domínio do problema quanto das ferramentas, de modo a gerar e parametrizar o modelo corretamente. Visto isso, novas técnicas e algoritmos ganham destaque na tarefa tornar tal processo mais automatizado e com menos dependência de um especialista. Esses fazem parte de um paradigma conhecido por Automated Machine Learning. Uma das abordagens pertencente a essa família de algoritmos consiste no uso de operadores genéticos para a concepção de redes neurais artificiais, tal técnica é conhecida por neuroevolução, sendo essa capaz de atuar na evolução dos elementos topológicos da rede, possibilitando assim, que ela se adapte a cenários de diferentes complexidades. Dentro do paradigma de aprendizado de máquina, existe uma linha de pensamento que defende que na resolução de um problema, um conjunto de preditores (comitê), quando combinados por algum critério de agregação, tende a obter melhores resultados se comparado a um único preditor. Porém, para que isso seja possível, se acredita ser necessário um comitê que contenha integrantes diversos, ou seja, que mapeiem o problema de forma distinta e eficiente, bem como, tenham seus votos agregados adequadamente para que o resultado final seja satisfatório. Nesse contexto, a aplicação de algoritmos de neuroevolução se apresenta como um candidato para a geração dos integrantes do comitê, já que esses são capazes de conceber redes com estrutura interna distinta durante o processo evolutivo, o que pode resultar em diversidade de respostas a serem combinadas por estratégias de agregação. Portanto, esse trabalho explora o uso de neuroevolução para a criação de comitê de Redes Neurais Artificiais, assim como, empregando diferentes estratégias de agregação de votos, a fim de formar comitês com redes diversas. Apresentou-se 5 diferentes classificadores resultantes do arcabouço proposto, sendo evidenciados resultados superiores em 5 das 10 bases de dados quando comparado a outros 7 métodos de aprendizado de máquina consolidados na literatura, demonstrando ganhos de até 12,5% frente ao melhor método de base de comparação, confirmando dentro do escopo dos experimentos as hipóteses do trabalho.
- ItemAcesso aberto (Open Access)Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.(Universidade Federal de São Paulo, 2022-08-19) Buris, Luiz Henrique [UNIFESP]; Faria, Fabio Augusto [UNIFESP]; http://lattes.cnpq.br/3828728429230356; http://lattes.cnpq.br/1837287108723885As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.