Construção, aplicação e avaliação de classificador de conteúdos textuais web por meio de descritores em Ciência da Saúde (DeCS)

Construção, aplicação e avaliação de classificador de conteúdos textuais web por meio de descritores em Ciência da Saúde (DeCS)

Título alternativo Construction, implementation and evaluation of textual content classifier web by means of Health Sciences Descriptors (DeCS)
Autor Mancini, Felipe Autor UNIFESP Google Scholar
Orientador Pisa, Ivan Torres Autor UNIFESP Google Scholar
Resumo Cada vez mais usuarios da internet utilizam a rede mundial com o objetivo de buscar informacoes relacionadas a sua Saúde. Esse cenario demanda a criacao de ferramentas especializadas capazes de apoiar o usuario em sua busca. Objetivos: Aplicar e comparar a aplicacao do Descritor em Ciências em Saúde (DeCS) na construcao de um classificador automatico de conteudos web em Saúde, com foco no publico leigo. Tambem foi avaliada a adaptacao deste classificador em um buscador de conteudos web desenvolvido neste estudo. Este buscador foi nomeado de Portal Web Busca Saúde. Metodos: Foram utilizadas 3.658 paginas web brasileiras para treinar o classificador e 606 paginas web brasileiras para valida-lo. Os classificadores propostos foram construidos a partir de metodos vetoriais de classificacao de texto baseados em conteudos, de maneira que o Bayesiano Ingenuo foi utilizado para a tarefa de classificacao de padroes. Foi avaliada a utilizacao do Busca Saúde por meio de analise de logs do buscador e questionario de avaliacao. Tambem foram investigadas as opinioes dos usuarios sobre o Busca Saúde, realizadas a partir de entrevistas e aplicacao da estrategia de analise de conteudo de Bardin. Resultados: A estrategia denominada InDeCS foi desenvolvida especificamente para adaptar o DeCS para o problema proposto, sendo que esta abordagem obteve melhor acuracia para esta tarefa de classificacao de padroes (0,94 de sensibilidade,especificidade e area sob a curva ROC).Foi identificado que o Busca Saúde atendeu ao objetivo em favorecer consultas em paginas web em Saúde, entretanto a interface grafica proposta para o InDeCS nao foi compreendida pelos participantes de pesquisa. Conclusao: O DeCS apresentou resultados relevantes quando utilizado para tarefa de classificacao de conteudos web com foco no publico leigo. Tambem foi possivel mostrar que o DeCS conseguiu mapear melhor caracteristicas mutaveis e nao-deterministicas da web, se comparado com as estrategias classicas. Alem disto, foi identificado que a interface utilizada para o InDeCS ao Busca Saúde nao conseguiu representar seu real objetivo para os participantes do estudo. Por fim, as analises apresentadas da avaliacao do Busca Saúde foram imprescindiveis para aprimorar o nivel de maturidade do sistema construido
Assunto Internet
Classificação
Vocabulário controlado
Processamento de linguagem natural
Informática médica
Interface usuário-computador
Idioma Português
Data 2011
Publicado em São Paulo: [s.n.], 2011. 111 p.
Editor Universidade Federal de São Paulo (UNIFESP)
Extensão 111 p.
Direito de acesso Acesso restrito
Tipo Tese de doutorado
URI http://repositorio.unifesp.br/handle/11600/21691

Mostrar registro completo




Arquivos deste item

Arquivos Tamanho Formato Visualização

Não existem arquivos associados a este item.

Este item aparece na(s) seguinte(s) coleção(s)