Navegando por Palavras-chave "Meta-learning"
Agora exibindo 1 - 5 de 5
Resultados por página
Opções de Ordenação
- ItemSomente MetadadadosData complexity meta-features for regression problems(Springer, 2018) Lorena, Ana C. [UNIFESP]; Maciel, Aron I. [UNIFESP]; de Miranda, Pericles B. C.; Costa, Ivan G.; Prudencio, Ricardo B. C.In meta-learning, classification problems can be described by a variety of features, including complexity measures. These measures allow capturing the complexity of the frontier that separates the classes. For regression problems, on the other hand, there is a lack of such type of measures. This paper presents and analyses measures devoted to estimate the complexity of the function that should fitted to the data in regression problems. As case studies, they are employed as meta-features in three meta-learning setups: (i) the first one predicts the regression function type of some synthetic datasets; (ii) the second one is designed to tune the parameter values of support vector regressors; and (iii) the third one aims to predict the performance of various regressors for a given dataset. The results show the suitability of the new measures to describe the regression datasets and their utility in the meta-learning tasks considered. In cases (ii) and (iii) the achieved results are also similar or better than those obtained by the use of classical meta-features in meta-learning.
- ItemAcesso aberto (Open Access)Meta-analysis of clustering problem instances and techniques in machine learning(Universidade Federal de São Paulo, 2022-02-11) Fernandes, Luiz Henrique dos Santos [UNIFESP]; Lorena, Ana Carolina; http://lattes.cnpq.br/3451628262694747; http://lattes.cnpq.br/8629213307451924A seleção do algoritmo mais efetivo a ser aplicado em determinada instância, baseado nas características desta, é um problema que vem sendo estudado na área de meta-aprendizado. Nesta abordagem, o propósito é estabelecer uma relação entre os atributos dos problemas e o desempenho de um conjunto de algoritmos que podem ser utilizados para resolvê-los. Meta-aprendizado vem sendo empregado em diversos problemas de Aprendizado de Máquina, como classificação, regressão, otimização e agrupamento de dados, por exemplo. Agrupamento de dados, ou data clustering, é um problema exigido em várias aplicações, desde segmentação de mercado até análise de dados baseados no genoma. No entanto, a definição de um agrupamento, ou cluster, não é única. Existem vários algoritmos com diferentes vieses que encontram diferentes tipos de estruturas nos dados. Por exemplo, pode-se maximizar a separabilidade do clusters ou encontrar regiões densas no espaço para definição dos clusters. A finalidade da presente pesquisa é avaliar objetivamente o desempenho de algoritmos de agrupamento em Aprendizado de Máquina e analisar o impacto da escolha de instâncias de teste por meio de uma abordagem baseada em um framework de espaço de instâncias que foi aplicado com sucesso em problemas de classificação e regressão. Durante o estudo, foram abordados diversos aspectos interessantes do problema de agrupamento que possibilitam a exploração das propriedades e limitações das instâncias de teste. Foi proposta, também, uma metodologia para geração de novas instâncias de teste para problemas de agrupamento, no intuito de preencher e diversificar o espaço de instâncias. Com isso, pôde-se analisar e compreender as relações das instâncias com o desempenho dos diversos algoritmos de agrupamento de dados disponíveis atualmente, de forma a revelar as forças e fraquezas dos algoritmos em relação ao grau de dificuldade inerente às variadas instâncias do problema de agrupamento de dados.
- ItemSomente MetadadadosNoise detection in the meta-learning level(Elsevier Science Bv, 2016) Garcia, Luis P. F.; de Carvalho, Andre C. P. L. F.; Lorena, Ana C. [UNIFESP]The presence of noise in real data sets can harm the predictive performance of machine learning algorithms. There are several noise filtering techniques whose goal is to improve the quality of the data in classification tasks. These techniques usually scan the data for noise identification in a preprocessing step. Nonetheless, this is a non-trivial task and some noisy data can remain unidentified, while safe data can also be removed. The bias of each filtering technique influences its performance on a particular data set. Therefore, there is no single technique that can be considered the best for all domains or data distribution and choosing a particular filter is not straightforward. Meta-learning has been largely used in the last years to support the recommendation of the most suitable machine learning algorithm(s) for a new data set. This paper presents a meta-learning recommendation system able to predict the expected performance of noise filters in noisy data identification tasks. For such, a meta-base is created, containing meta-features extracted from several corrupted data sets along with the performance of some noise filters when applied to these data sets. Next, regression models are induced from this meta base to predict the expected performance of the investigated filters in the identification of noisy data. The experimental results show that meta-learning can provide a good recommendation of the most promising filters to be applied to new classification data sets. (C) 2015 Elsevier B.V. All rights reserved.
- ItemAcesso aberto (Open Access)Proposal for a new approach to forecast spare parts demand(Universidade Federal de São Paulo, 2021-08-03) Acayaba, Gabriel Medrado Assis [UNIFESP]; Oliveira, Tiago de [UNIFESP]; Sato, Renato Cesar [UNIFESP]; http://lattes.cnpq.br/6095929487408447; http://lattes.cnpq.br/8390665307472965; http://lattes.cnpq.br/1873663378106030A previsão de peças de reposição para apoiar as operações de manutenção é essencial para garantir a disponibilidade dos mais diversos serviços. Este documento tem como objetivo investigar quais técnicas têm sido propostas para prever a demanda por peças de reposição, bem como em que medida essas técnicas foram validadas em ambientes industriais. O documento também visa desenvolver uma nova metodologia de previsão de peças de reposição por meio da seleção ou combinação de técnicas de previsão. Primeiramente, conduzimos uma Revisão Sistemática da Literatura sobre o tema de Previsão de Demanda de Peças de Reposição. As principais conclusões da revisão são de que falta um estudo comparativo quanto ao desempenho entre as técnicas analisadas e que muitos estudos ainda lutam com a necessidade de grandes volumes de dados e grandes conjuntos de variáveis. O presente estudo baseia-se nessas lacunas e implementa um algoritmo de meta-aprendizagem. Uma base de dados real de demanda de peças de reposição do setor aeroespacial é usada como entrada para um Classificador Random Forest para selecionar entre os modelos Random Walk, Theta, ARIMA, Exponential Smoothing e Neural Network para prever a demanda e calcular as combinações de previsão. Os novos métodos são então comparados com métodos convencionais e com um software de uso comprovado pela indústria. A metodologia de previsão de meta-aprendizado proposta mostra-se uma opção válida e competitiva para prever a demanda de peças de reposição e apresenta bons resultados quando comparada aos métodos convencionais de previsão e também quando comparada a uma solução comprovada usada pela indústria que possui seu próprio algoritmo de seleção de métodos de previsão. As previsões de combinação linear ponderada mostraram bons resultados gerais e conseguiram melhorar a precisão média das previsões. Finalmente, uma aplicação web simples foi desenvolvida como uma prova de conceito para uso industrial.
- ItemAcesso aberto (Open Access)Seleção supervisionada de meta-heurísticas para o problema bipartite graph drawing(Universidade Federal de São Paulo, 2021-08-16) Ferrari, Bruno José Dreux [UNIFESP]; Rosset, Mariá Cristina Vasconcelos Nascimento [UNIFESP]; http://lattes.cnpq.br/1010810293243435; http://lattes.cnpq.br/2523020753840807O processo de visualização da informação é um tópico relevante para o estudo em Ciência da Computação. Dados e informações, quando apresentados de maneira intuitiva, ajudam o usuário a entender relações relevantes e a extrair novas informações de dados abstratos de maneira eficiente. Neste universo de visualização da informação, os grafos são uma forma bem estabelecida e aceita para se representar diversas informações. São estruturas que modelam diversos problemas e são utilizadas em vários cenários, como representações de redes sociais, ligações entre páginas na web, planejamento de produção, dentre outras. Entretanto, como são estruturas que não possuem ordem, podem ser de difícil entendimento caso não estejam dispostos de maneira organizada. Portanto, para que as informações contidas possam ser visualizadas corretamente, é importante que suas representações sejam feitas utilizando algum critério estético. Por ser uma forma de abstração que por construção, representa objetos de natureza combinatória, o problema de encontrar uma representação que seja ótima em algum critério, se faz necessário, na maioria das vezes, a resolução de problemas da classe NP-Completo, sendo necessário a utilização de heurísticas para uma solução rápida do problema. Nesse contexto, existem diversas meta-heurísticas que resolvem esse problema, conhecido por graph drawing, cujas meta-heurísticas diferenciam-se em seu desempenho a depender das instâncias estudadas. Dessa forma, o presente trabalho apresenta um método de seleção de algoritmos para o problema de graph drawing, por uma estratégia de aprendizado supervisionado (meta-aprendizado) baseada em algoritmos de classificação. 1240 grafos e 16 classificadores foram considerados em testes computacionais, sendo que, em termos de acurácia, seleções não melhores que a incidência da melhor meta-heurística foram encontradas. Em outras palavras, o método selecionou, proporcionalmente, de forma correta, na proporção equivalente à do algoritmo com maior parcela de melhores resultados. Após a análise dos resultados, concluiu-se que fatores para tal acontecimento foram a homogeneidade tanto de soluções geradas, isto é, resultados em geral muito próximos, quanto de grafos considerados, isto é, instâncias com características similares.