Seleção de elementos rotulados para o aprendizado semissupervisionado baseado em grafos

View/ Open
Date
2020-10-02Author
Y. Sato, Thiago [UNIFESP]
Advisor
Berton, Lilian [UNIFESP]Type
Trabalho de conclusão de curso de graduaçãoMetadata
Show full item recordAbstract
A escassez de dados rotulados tem aumentado o interesse no aprendizado semissupervi-
sionado, o qual emprega uma proporção pequena de dados rotulados e uma proporção
grande de dados não-rotulados para realizar classificação em grandes bases de dados. Este
trabalho tem como objetivo analisar a influência de elementos rotulados no aprendizado
semissupervisionado. Buscamos melhorar a performance de modelos semissupervisionados
baseados em grafos a partir da seleção de elementos rotulados. As seleções foram baseadas
na importância do nó dentro do grafo, utilizando-se de medidas de centralidade, dentre
essas medidas, a métrica betweeness teve destaque. Também analisamos a distribuição de
elementos rotulados por comunidades e notamos que quando essa distribuição é balanceada
há um aumento na acurácia.
Keywords
classificação de dadosaprendizado de máquina
aprendizado semissupervisionado
métodos baseados em grafos
medidas de centralidade
comunidades