Comparação de Métodos de Active-Querying e Agrupamento com Restrição Aplicados a Dados de RNA-seq de Câncer de Mama

dc.contributor.advisorKuroshu, Reginaldo Massanobu [UNIFESP]
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5604719921386043pt_BR
dc.contributor.authorSanches, Maria Luísa Santos Moreno [UNIFESP]
dc.contributor.authorLatteshttp://lattes.cnpq.br/5730487542939699pt_BR
dc.coverage.spatialSão José dos Campos, SPpt_BR
dc.date.accessioned2023-08-07T12:28:30Z
dc.date.available2023-08-07T12:28:30Z
dc.date.issued2023-07-12
dc.description.abstractO câncer de mama é uma das principais causas de morte por câncer em mulheres, sendo o tipo mais comum de câncer entre elas. Este projeto tem como objetivo aplicar técnicas de computação e análise de dados na área da bioinformática para identificar os subtipos moleculares do câncer de mama. Para isso, foram utilizados os algoritmos de agrupamento COBRAS e Min-Max em um conjunto de dados de expressão gênica de pacientes com câncer de mama, com o intuito de comparar seus desempenhos. Os resultados mostraram que o algoritmo COBRAS obteve um desempenho superior em relação ao Min-Max, apresentando melhores índices de concordância (ARI e NMI) e sendo capaz de identificar os subtipos moleculares com sucesso. Além disso, o COBRAS mostrou-se eficiente no agrupamento de dados classificados como Tumor e Tecido Normal. Por outro lado, o Min-Max enfrentou dificuldades na identificação precisa dos subtipos, além de demandar um tempo de execução significativamente maior. Esses resultados ressaltam a importância do uso de abordagens baseadas em restrições de similaridade, como o COBRAS, para lidar com a complexidade e sobreposição dos subtipos moleculares em conjuntos de dados de expressão gênica de câncer de mama. O conhecimento mais preciso dos subtipos moleculares é fundamental para o desenvolvimento de estratégias de diagnóstico e tratamento mais eficazes, com potencial impacto positivo na luta contra o câncer de mama.pt_BR
dc.description.abstractBreast cancer is one of the leading causes of cancer-related death in women, and it is the most common type of cancer among them. This project aims to apply computational and data analysis techniques in the field of bioinformatics to identify molecular subtypes of breast cancer. The COBRAS and Min-Max clustering algorithms were employed on a gene expression dataset of breast cancer patients to compare their performances. The results showed that the COBRAS algorithm outperformed Min-Max, demonstrating better agreement indices (ARI and NMI) and successfully identifying the molecular subtypes. Additionally, COBRAS exhibited efficiency in clustering data classified as Tumor and Normal Tissue. On the other hand, Min-Max faced difficulties in accurately identifying the subtypes and required significantly longer execution time. These findings emphasize the importance of utilizing similarity-constrained approaches, such as COBRAS, to handle the complexity and overlapping nature of molecular subtypes in breast cancer gene expression datasets. Accurate knowledge of molecular subtypes is crucial for the development of more effective diagnostic and treatment strategies, with the potential for a positive impact in the fight against breast cancer.pt_BR
dc.description.sponsorshipNão recebi financiamentopt_BR
dc.emailadvisor.customrmkuroshu@unifesp.brpt_BR
dc.format.extent51 f.pt_BR
dc.identifier.urihttps://repositorio.unifesp.br/handle/11600/68985
dc.languageporpt_BR
dc.publisherUniversidade Federal de São Paulopt_BR
dc.rightsinfo:eu-repo/semantics/openAccesspt_BR
dc.subjectCâncer de mamapt_BR
dc.subjectalgoritmo de Active-Queryingpt_BR
dc.subjectdados de RNA-seqpt_BR
dc.subjectalgoritmo de agrupamentopt_BR
dc.titleComparação de Métodos de Active-Querying e Agrupamento com Restrição Aplicados a Dados de RNA-seq de Câncer de Mamapt_BR
dc.title.alternativeComparison of Active-Querying and Constrained Clustering Methods Applied to Breast Cancer RNA-seq Datapt_BR
dc.typeinfo:eu-repo/semantics/bachelorThesispt_BR
unifesp.campusInstituto de Ciência e Tecnologia (ICT)pt_BR
unifesp.graduacaoEngenharia de Computaçãopt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
monografia (1).pdf
Tamanho:
2 MB
Formato:
Adobe Portable Document Format
Descrição:
Trabalho de Conclusão de Curso
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
5.73 KB
Formato:
Item-specific license agreed upon to submission
Descrição: