Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial

Carregando...
Imagem de Miniatura
Data
2024-04-25
Autores
Nakayama, Luis Filipe [UNIFESP]
Orientadores
Regatieri, Caio Vinicius Saito [UNIFESP]
Tipo
Tese de doutorado
Título da Revista
ISSN da Revista
Título de Volume
Resumo
Objetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial.
Objective: This project aimed to comprehend the landscape of artificial intelligence (AI) with a focus on its applications in the healthcare sector, particularly in ophthalmology and retina analysis. The objectives included identifying opportunities and challenges for the development of AI systems in healthcare, with an emphasis on addressing biases and improving database representativeness. We conducted experiments to validate and establish baseline results in classifying diabetic retinopathy and determining the gender of patients through retinography analysis. Methods: The creation of BRSET involved compiling a database with 16,255 images from 8,524 Brazilian patients, with multiple classifications. Experiments were conducted to validate the utility of BRSET, including diabetic retinopathy detection, patient gender identification, and image manipulation for privacy enhancement. We utilized the ConvNext V2, ResNet200D, and Inception-V3 neural networks, with saliency maps generated to identify focus areas for diabetic retinopathy classification and patient gender. Results: BRSET gathered a set of 16,255 images from 8,524 Brazilian patients, with various classifications. It comprises 61.8% female patients, with an average age of 57.6 (±18.26) years, and diabetic retinopathy is present in 15.8% of images. In the retinopathy classification task, ConvNext V2 stood out with an AUC of 97% and macro F1 of 89%, while converting images into vectors resulted in AUCs between 75-77% and F1s between 62-67%. In the gender identification task, ResNet-200D achieved accuracies of up to 82.6%, and ConvNext V2 obtained an AUC of 91% and macro F1 of 83%, with lower results when converting images into vectors (AUCs of 66-68% and F1s of 65-68%). Image manipulation techniques demonstrated the feasibility of enhancing privacy while maintaining diagnostic utility in diabetic retinopathy classification. Saliency maps provided insights into localized focus areas for disease classification and global areas for gender prediction. The algorithm developed with Brazilian patients yielded an AUC of 97%, sensitivity of 96.02%, and specificity of 79.93% for detecting referable cases of diabetic retinopathy. Conclusions: The experiments showed performance comparable to the literature for classifying cases of diabetic retinopathy, identifying patient gender, and demonstrated that pixel manipulation is a viable way to enhance image privacy while maintaining utility in diabetic retinopathy classification, and indicate that the implementation of automated systems represents an alternative to improve the screening flow of diabetic retinopathy in Brazil. The project established baseline results, guide the scientific community on how to utilize the database and validate BRSET as a useful database for projects in data science and AI. BRSET was proposed as a project enabling the development of data science projects, as well as teaching activities, with the aim of increasing data representativeness from Brazil and reducing biases in AI system implementations.
Descrição
Citação
NAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024.