Aplicação de técnicas de mineração de textos para categorização de diagnósticos em laudos de biópsias renais.

Aplicação de técnicas de mineração de textos para categorização de diagnósticos em laudos de biópsias renais.

Autor Reis, Amanda Rocha Autor UNIFESP Google Scholar
Orientador Pisa, Ivan Torres Autor UNIFESP Google Scholar
Instituição Universidade Federal de São Paulo (UNIFESP)
Pós-graduação Gestão e informática em saúde – São Paulo
Resumo Objetivo: Observa-se uma escassez de informacao sobre prevalencia e incidencia das doencas renais na populacao. De forma geral, os estudos utilizam como metodo de analise das doencas a estatistica descritiva, identificando e apresentando prevalencias, frequencias relativas e absolutas, distribuicoes por tipo de doencas renais, genero, idade, regioes do pais, raca etc., assim como analises historicas. O objetivo deste estudo foi extrair padroes diagnosticos de laudos de biopsia renal e avaliar possibilidades de criacao de categorias diagnosticas com o uso tecnicas de minera-cao de textos e analise de agrupamento. Metodos: A partir de um estudo retrospec-tivo foi acessado um conjunto de 17.847 laudos de biopsia, com resultados de exa-mes anatomopatologicos, referentes aos anos de 1993, 2001-2006, 2009-2010, rea-lizados pelo mesmo patologista. Foi acessado tambem um conjunto de 5.704 pedi-dos medicos para a realizacao dos respectivos exames anatomopatologicos do peri-odo 2009-2010. Para estruturacao e analise dos dados foram adotadas tecnicas de mineracao de textos, incluindo tecnica descritiva de analise de agrupamentos dos documentos medicos. Para a analise de agrupamento utilizou-se o algoritmo K-means. Resultados: O pre-processamento dos textos resultou 694 diagnosticos completos diferentes. Na analise de agrupamentos a melhor configuracao foi obtida com onze grupos de documentos medicos descritos segundo suas caracteristicas mais relevantes. Conclusao: A tecnica de mineracao de textos possibilitou gerar uma taxonomia em formato de arvore composta por 206 termos ordenados, ocorren-do 20.599 vezes em 3.018 laudos. Com o uso do algoritmo K-means foi possivel ca-racterizar os 3.018 documentos medicos em onze agrupamentos homogeneos, sem o conhecimento previo do especialista. Os resultados do trabalho podem contribuir com a construcao de sistemas de auditoria e de treinamento de patologistas.
Palavra-chave Biópsia
Patologia
Mineração de Dados
Processamento de Linguagem Natural
Idioma Português
Data de publicação 2013
Publicado em São Paulo: [s.n.], 2013. 96 p.
Publicador Universidade Federal de São Paulo (UNIFESP)
Extensão 96 p.
Direito de acesso Acesso restrito
Tipo Dissertação de mestrado
Endereço permanente http://repositorio.unifesp.br/handle/11600/22933

Exibir registro completo




Arquivo

Arquivo Tamanho Formato Visualização

Não existem arquivos associados a este item.

Este item está nas seguintes coleções

Buscar


Navegar

Minha conta