Seleção de elementos rotulados para o aprendizado semissupervisionado baseado em grafos
Data
2020-10-02
Tipo
Trabalho de conclusão de curso
Título da Revista
ISSN da Revista
Título de Volume
Resumo
A escassez de dados rotulados tem aumentado o interesse no aprendizado semissupervi-
sionado, o qual emprega uma proporção pequena de dados rotulados e uma proporção
grande de dados não-rotulados para realizar classificação em grandes bases de dados. Este
trabalho tem como objetivo analisar a influência de elementos rotulados no aprendizado
semissupervisionado. Buscamos melhorar a performance de modelos semissupervisionados
baseados em grafos a partir da seleção de elementos rotulados. As seleções foram baseadas
na importância do nó dentro do grafo, utilizando-se de medidas de centralidade, dentre
essas medidas, a métrica betweeness teve destaque. Também analisamos a distribuição de
elementos rotulados por comunidades e notamos que quando essa distribuição é balanceada
há um aumento na acurácia.