Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano

Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano

Título alternativo Analysis of similarity between the sequences of genes of HIV-1 and Human Genome
Autor Galinskas, Juliana Autor UNIFESP Google Scholar
Orientador Janini, Luiz Mário Ramos Autor UNIFESP Google Scholar
Instituição Universidade Federal de São Paulo (UNIFESP)
Pós-graduação Infectologia – São Paulo
Resumo It is possible that viral genes have cellular origins. They may have been gathered during evolution, and each one may correspond to a distinct origin. The similarity between genetic sequences suggest homology and, therefore, an evolutive relationship. The present study aimed at identifying region with similarity, with significant statistic support, between the human and the HIV-1 genome through the comparative analysis between DNA sequences using the BLAST program. It is also our purpose to develop a methodology which allows the comparison between genetic sequences of diverse organisms, quantifying the similarity. Thus, to carry it through, we use the BLASTn software (2.2.20 version) and a local database of human chromosomes. Python (5.1.30 version) is used for sequence processing and the data analysis is made using the SQL (Structured Query Language). The human genome is compared to sequences from: HIV-1 genes, Tobbaco Mosaic Virus genes (negative non-biologic control), chromosomes motifs of Macaca mulatta (positive biologic control) and random sequences (negative non-biologic control). We find differences between all the HIV-1 genes and the LTR region. Some genes show more similarity with the human genome than others, according to the curve fitting analysis. When analyzing the curve obtained at very low E-values, it is observed that all HIV-1 genes are well represented by a non-linear curve fitting y = a0 . xa1 where a0 and a1 are parameters obtained numerically. As a result, the method is validated using the data from the genome of Macaca mulatta for which a high level of similarity with the human genome is observed. Based on this validation, it is possible to form three distinct groups of genes from HIV-1 according to the a1 value where: the env, gag, nef, pol, rev, tat and vif genes have identical a1 values; the vpr gene a very low a1 value; and the vpu a a1 higher value.

Os genes virais podem ter origens celulares ou não. Eles podem ter sido reunidos durante a evolução, sendo que cada um pode corresponder a uma origem distinta. A similaridade entre sequências genéticas sugerem homologia e, portanto, um parentesco evolutivo. O presente estudo tem como objetivo identificar regiões de similaridade, com suporte estatístico confiável, entre o genoma do HIV-1 e o genoma humano a partir da análise comparativa entre sequências de DNA, por meio do programa BLAST. Também é de nosso interesse desenvolver uma metodologia que permita comparar sequências genéticas de diversos organismos, de forma que a similaridade possa ser quantificada. Para realizar as comparações entre as sequências genéticas, é utilizada a ferramenta BLASTn (versão 2.2.20) e um banco de dados local composto pelos cromossomos humanos. Python (versão 5.1.30) é utilizada para o processamento das sequências, e a análise dos dados é feita utilizando a linguagem estruturada de consulta SQL (Structured Query Language). O genoma humano é comparado com: sequências dos genes do HIV-1, sequências de genes do vírus do mosaico do tabaco (controle negativo biológico), trechos de cromossomos da Macaca mulatta (controle positivo biológico) e sequências aleatórias (controle negativo não biológico). O presente estudo demonstra diferenças entre os genes do HIV-1 e a região LTR. Alguns genes demonstram maior similaridade com o genoma humano do que outros, de acordo com a análise da curva do fitting. Ao verificar a curva obtida a partir de E-values muito baixos, observa-se que todos os genes do HIV-1 apresentam curva não linear do tipo y = a0 . xa1, onde a0 e a1 são parâmetros obtidos a partir de ajuste numérico. O método é validado utilizando dados do genoma da Macaca mulatta, pelo qual é observada alta similaridade com o genoma humano. A partir desta validação é possível construir três diferentes grupos de genes do HIV-1 de acordo com o valor de a1, onde: os genes env, gag, nef, pol, rev, tat e vif apresentam valores de a1 idênticos, o gene vpr um valor mais baixo e o gene vpu um valor bem mais alto.
Palavra-chave Genoma humano
HIV-1
Idioma Português
Data de publicação 2010-03-31
Publicado em GALINSKAS, Juliana. Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano. 2010. 86 f. Dissertação (Mestrado em Ciências) - Escola Paulista de Medicina, Universidade Federal de São Paulo, São Paulo, 2010.
Publicador Universidade Federal de São Paulo (UNIFESP)
Extensão 86 f.
Direito de acesso Acesso aberto Open Access
Tipo Dissertação de mestrado
Endereço permanente http://repositorio.unifesp.br/handle/11600/8922

Exibir registro completo




Arquivo

Nome: Publico-260.pdf
Tamanho: 1.442MB
Formato: PDF
Descrição:
Abrir arquivo

Este item está nas seguintes coleções

Buscar


Navegar

Minha conta