Construção Automática De Funções De Kernel Para Support Vector Machines Por Meio De Evolução Gramatical
Data
2017-02-16
Tipo
Dissertação de mestrado
Título da Revista
ISSN da Revista
Título de Volume
Resumo
One of the key aspects in the successful use of kernel methods such as Support Vector Machines (SVMs) is the choice of kernel function. A good function is one that maps the input space into a feature space that allows a good separation of the points that compose the dataset. There are several known kernels in the literature that have been manually developed. Among them are the Polynomial, RBF (Radial Basis Function) and Sigmoid kernels. While using these functions can produce satisfactory results for various applications, success in its use is not guaranteed and depends on the choice of parameters associated with these functions. iii Another way to find the best kernel that fits the dataset is th- rough the automatic generation of the function. With this objective the Grammatical Evolution for automatically Evolving Kernel functi- ons (GEEK) was created. GEEK uses a grammar composed of mathe- matical equations extracted from known kernels. When combined th- rough the Gramatical Evolution, these equations give rise to more complex kernels. The results obtained by GEEK were compared in several datasets against the RBF, Polinomial and Sigmoidal kernels, in order to evalu- ate its effectiveness. The grammar used configuration was able to pre- sent results that were not statistically different from the other kernels. Nevertheless, by analyzing solely unbalanced datasets, the GEEK pre- sented a more representative separation of the classes, where the ker- nels compared were biased to the class with more examples.
Um dos aspectos principais no uso bem sucedido de métodos de kernel como as Máquinas de Vetores de Suporte (Support Vector Machi- nes - SVMs) é a escolha da função de kernel. Uma boa função é aquela que mapeia o espaço de atributos em um espaço de características que permite uma boa separação dos pontos que compõem o dataset. Existem diversos kernels conhecidos pela literatura que foram de- senvolvidos manualmente. Dentre eles estão o Polinomial, RBF (Ra- dial Basis Function) e Sigmoidal. Embora utilizar estas funções pode produzir resultados satisfatórios para diversas aplicações, o sucesso no uso não é garantido e depende da escolha de parâmetros associa- dos a estas funções. Outra maneira de encontrar o kernel que mais se adequa ao data- set é através da geração automática da função. Com esse objetivo foi desenvolvido o método de Evolução Gramatical para a evoluir au- tomaticamente funções de kernel (em inglês Grammatical Evolution for automatically Evolving Kernel functions, ou GEEK). O GEEK utiliza uma gramática composta por equações matemáticas extraídas de kernels já conhecidos. Quando combinadas através da Evolução Gramatical, es- tas equações dão origem a kernels mais complexos. Os resultados obtidos pelo GEEK foram comparados, para diver- sos datasets, com os kernels RBF, Polinomial e Sigmoidal, de modo a aferir sua eficácia. A configuração da gramática utilizada conse- guiu apresentar resultados que não foram estatisticamente diferentes das outras técnicas. Apesar disso, analisando isoladamente datasets desbalanceados, o GEEK apresentou uma separação mais representa- tiva das classes, onde os kernels comparados foram mais tendenciados para a classe com mais exemplos
Um dos aspectos principais no uso bem sucedido de métodos de kernel como as Máquinas de Vetores de Suporte (Support Vector Machi- nes - SVMs) é a escolha da função de kernel. Uma boa função é aquela que mapeia o espaço de atributos em um espaço de características que permite uma boa separação dos pontos que compõem o dataset. Existem diversos kernels conhecidos pela literatura que foram de- senvolvidos manualmente. Dentre eles estão o Polinomial, RBF (Ra- dial Basis Function) e Sigmoidal. Embora utilizar estas funções pode produzir resultados satisfatórios para diversas aplicações, o sucesso no uso não é garantido e depende da escolha de parâmetros associa- dos a estas funções. Outra maneira de encontrar o kernel que mais se adequa ao data- set é através da geração automática da função. Com esse objetivo foi desenvolvido o método de Evolução Gramatical para a evoluir au- tomaticamente funções de kernel (em inglês Grammatical Evolution for automatically Evolving Kernel functions, ou GEEK). O GEEK utiliza uma gramática composta por equações matemáticas extraídas de kernels já conhecidos. Quando combinadas através da Evolução Gramatical, es- tas equações dão origem a kernels mais complexos. Os resultados obtidos pelo GEEK foram comparados, para diver- sos datasets, com os kernels RBF, Polinomial e Sigmoidal, de modo a aferir sua eficácia. A configuração da gramática utilizada conse- guiu apresentar resultados que não foram estatisticamente diferentes das outras técnicas. Apesar disso, analisando isoladamente datasets desbalanceados, o GEEK apresentou uma separação mais representa- tiva das classes, onde os kernels comparados foram mais tendenciados para a classe com mais exemplos