Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano

Data
2010-03-31
Tipo
Dissertação de mestrado
Título da Revista
ISSN da Revista
Título de Volume
Resumo
It is possible that viral genes have cellular origins. They may have been gathered during evolution, and each one may correspond to a distinct origin. The similarity between genetic sequences suggest homology and, therefore, an evolutive relationship. The present study aimed at identifying region with similarity, with significant statistic support, between the human and the HIV-1 genome through the comparative analysis between DNA sequences using the BLAST program. It is also our purpose to develop a methodology which allows the comparison between genetic sequences of diverse organisms, quantifying the similarity. Thus, to carry it through, we use the BLASTn software (2.2.20 version) and a local database of human chromosomes. Python (5.1.30 version) is used for sequence processing and the data analysis is made using the SQL (Structured Query Language). The human genome is compared to sequences from: HIV-1 genes, Tobbaco Mosaic Virus genes (negative non-biologic control), chromosomes motifs of Macaca mulatta (positive biologic control) and random sequences (negative non-biologic control). We find differences between all the HIV-1 genes and the LTR region. Some genes show more similarity with the human genome than others, according to the curve fitting analysis. When analyzing the curve obtained at very low E-values, it is observed that all HIV-1 genes are well represented by a non-linear curve fitting y = a0 . xa1 where a0 and a1 are parameters obtained numerically. As a result, the method is validated using the data from the genome of Macaca mulatta for which a high level of similarity with the human genome is observed. Based on this validation, it is possible to form three distinct groups of genes from HIV-1 according to the a1 value where: the env, gag, nef, pol, rev, tat and vif genes have identical a1 values; the vpr gene a very low a1 value; and the vpu a a1 higher value.
Os genes virais podem ter origens celulares ou não. Eles podem ter sido reunidos durante a evolução, sendo que cada um pode corresponder a uma origem distinta. A similaridade entre sequências genéticas sugerem homologia e, portanto, um parentesco evolutivo. O presente estudo tem como objetivo identificar regiões de similaridade, com suporte estatístico confiável, entre o genoma do HIV-1 e o genoma humano a partir da análise comparativa entre sequências de DNA, por meio do programa BLAST. Também é de nosso interesse desenvolver uma metodologia que permita comparar sequências genéticas de diversos organismos, de forma que a similaridade possa ser quantificada. Para realizar as comparações entre as sequências genéticas, é utilizada a ferramenta BLASTn (versão 2.2.20) e um banco de dados local composto pelos cromossomos humanos. Python (versão 5.1.30) é utilizada para o processamento das sequências, e a análise dos dados é feita utilizando a linguagem estruturada de consulta SQL (Structured Query Language). O genoma humano é comparado com: sequências dos genes do HIV-1, sequências de genes do vírus do mosaico do tabaco (controle negativo biológico), trechos de cromossomos da Macaca mulatta (controle positivo biológico) e sequências aleatórias (controle negativo não biológico). O presente estudo demonstra diferenças entre os genes do HIV-1 e a região LTR. Alguns genes demonstram maior similaridade com o genoma humano do que outros, de acordo com a análise da curva do fitting. Ao verificar a curva obtida a partir de E-values muito baixos, observa-se que todos os genes do HIV-1 apresentam curva não linear do tipo y = a0 . xa1, onde a0 e a1 são parâmetros obtidos a partir de ajuste numérico. O método é validado utilizando dados do genoma da Macaca mulatta, pelo qual é observada alta similaridade com o genoma humano. A partir desta validação é possível construir três diferentes grupos de genes do HIV-1 de acordo com o valor de a1, onde: os genes env, gag, nef, pol, rev, tat e vif apresentam valores de a1 idênticos, o gene vpr um valor mais baixo e o gene vpu um valor bem mais alto.
Descrição
Citação
GALINSKAS, Juliana. Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano. 2010. 86 f. Dissertação (Mestrado em Ciências) - Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, 2010.
Palavras-chave

Pré-visualização PDF(s)