Uso De Medidas De Complexidade Em Seleção De Atributos

Okimoto, Lucas Chesini [UNIFESP]

Uso De Medidas De Complexidade Em Seleção De Atributos

dc.audience.educationlevel	Mestrado
dc.contributor.advisor	Lorena, Ana Carolina [UNIFESP]
dc.contributor.author	Okimoto, Lucas Chesini [UNIFESP]
dc.contributor.institution	Universidade Federal de São Paulo (UNIFESP)	pt
dc.date.accessioned	2020-03-25T11:43:47Z
dc.date.available	2020-03-25T11:43:47Z
dc.date.issued	2018-07-31
dc.description.abstract	Feature Selection Is An Important Pre-Processing Step Usually Mandatory In Data Analysis By Machine Learning Techniques. Its Objective Is To Reduce Data Dimensionality By Removing Irrelevant And Redundant Features From A Dataset. In This Work We Evaluate The Use Of Complexity Measures Of Classification Problems In Feature Selection (Fs). These Descriptors Allow Estimating The Intrinsic Difficulty Of A Classification Problem By Regarding On Characteristics Of The Dataset Available For Learning. We Propose A Combined Univariate-Multivariate Fs Technique Which Employs Two Of The Complexity Measures: Fisher "S Maximum Discriminant Ratio And Intra-Extra Class Distances. The Results Are Promising And Reveal That The Complexity Measures Are Indeed Suitable For Estimating Feature Importance In Classification Datasets. Large Reductions In The Numbers Of Features Were Obtained, While Preserving, In General, The Predictive Accuracy Of Two Strong Classification Techniques: Support Vector Machines And Random Forests.	en
dc.description.abstract	Feature Selection Is An Important Pre-Processing Step Usually Mandatory In Data Analysis By Machine Learning Techniques. Its Objective Is To Reduce Data Dimensionality By Removing Irrelevant And Redundant Features From A Dataset. In This Work We Evaluate The Use Of Complexity Measures Of Classification Problems In Feature Selection (Fs). These Descriptors Allow Estimating The Intrinsic Difficulty Of A Classification Problem By Regarding On Characteristics Of The Dataset Available For Learning. We Propose A Combined Univariate-Multivariate Fs Technique Which Employs Two Of The Complexity Measures: Fisher "S Maximum Discriminant Ratio And Intra-Extra Class Distances. The Results Are Promising And Reveal That The Complexity Measures Are Indeed Suitable For Estimating Feature Importance In Classification Datasets. Large Reductions In The Numbers Of Features Were Obtained, While Preserving, In General, The Predictive Accuracy Of Two Strong Classification Techniques: Support Vector Machines And Random Forests.	pt
dc.description.source	Dados abertos - Sucupira - Teses e dissertações (2018)
dc.format.extent	69 p.
dc.identifier	https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7085532	pt
dc.identifier.file	2018-0304.pdf
dc.identifier.uri	https://repositorio.unifesp.br/handle/11600/52365
dc.language.iso	eng
dc.publisher	Universidade Federal de São Paulo (UNIFESP)
dc.rights	info:eu-repo/semantics/restrictedAccess
dc.subject	Machine Learning	en
dc.subject	Feature Selection	en
dc.subject	Dimensionality	en
dc.subject	Complexity Measures	en
dc.subject	Classification	en
dc.subject	Classificação Supervisionada	pt
dc.subject	Redução De Dimensionalidade	pt
dc.subject	Seleção De Atributos	pt
dc.subject	Medidas De Complexidade	pt
dc.subject	Aprendizado De Máquina	pt
dc.title	Uso De Medidas De Complexidade Em Seleção De Atributos	pt
dc.type	info:eu-repo/semantics/masterThesis
unifesp.campus	São José dos Campos, Instituto de Ciência e Tecnologia	pt
unifesp.graduateProgram	Ciência Da Computação	pt
unifesp.knowledgeArea	Ciências Exatas E Da Terra	pt
unifesp.researchArea	Sistemas Inteligentes	pt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: dissertacao-lucas-okimoto_pos_revisao.pdf
Tamanho:: 1.79 MB
Formato:: Adobe Portable Document Format
Descrição:: Dissertação Lucas Chesini Okimoto

Baixar

Coleções

PPG - Ciência da Computação