Please use this identifier to cite or link to this item: http://repositorio.unifesp.br/handle/11600/46200
Title: Alinhamento, bottleneck, distância variacional, distribuição, dirichlet, diversidade genética, extinção, HIV-1, pnl43, profundidade, short-read, solid, taxa de substituição por sítio
Authors: Janini, Luiz Mario Ramos Janini [UNIFESP]
Zukurov, Lean Paulo Lopes [UNIFESP]
Universidade Federal de São Paulo (UNIFESP)
Keywords: alignment
bottleneck
variational distance
dirichlet distribution
genetic diversity
hiv-1 extinction
pnl4
depth
short-read
solid
substitution rate per site
alinhamento
bottleneck
distância variacional
distribuição dirichlet
diversidade genética
extinção hiv-1
pnl4
profundidade
short-read
solid
taxa de substituição por sítio
Issue Date: 4-Aug-2015
Publisher: Universidade Federal de São Paulo (UNIFESP)
Citation: ZUKUROV, Lean Paulo Lopes. Alinhamento, bottleneck, distância variacional, distribuição, dirichlet, diversidade genética, extinção, HIV-1, pnl43, profundidade, short-read, solid, taxa de substituição por sítio. 2015. 138 f. Tese (Doutorado) - Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2015.
Abstract: One of the most remarkable features of HIV-1 is the great diversity observed along with strains that involve the AIDS / HIV pandemic. However, through the transmission, an extremely low number of particles is transferred in the infection to the new host, leading to a drastic reduction in the genetic diversity of the original population. This phenomenon is called "bottleneck" and gives a potential risk to the survival of the infecting viral population. After the "bottleneck" genetic diversity, which had been lost, will then be recovered to allow the survival of the viral population in the new environment. This work was carried out the development of software TAnDen - Tool for Analysis of Diversity in Viral Populations to perform the alignment of short reads generated by the SOLiD-platform. A module for analysis of aligned short-reads using Bayesian inference with a Dirichlet distribution for the possible states in the control compared with the experimental data was developed. The running time of the alignment for each experimental condition with approximately 07 + 2,7E short-reads, was around 30 hours on average. During the alignment process 1.6 GB of RAM were needed. For the control and the other seven experimental conditions a total of 214 938 239 million (2,1E + 08) of short-reads, ie, approximately 1/5 billion of short-reads were generated. The total number of short-reads generated 144 097 035 million (1,4and + 08) were aligned and processed for further analysis. The mutational regime was analyzed during the bottleneck and after stabilization of viral sequence using TAnDen software. The progressive analysis of variational distance aims to explore in detail the main feature of viral successive crops that generated the data analyzed. The exclusion criteria for the values of 0.02 variational distance was used as the base. Only 1.51% of the total achieved the proposed exclusion criteria being considered polymorphic sites in relation to the adjacent previous condition. A trend of decreasing linear variational distance between the first and the last point of viral culture was perceived, and this can be correlated with viral load and extinction of the viral population viewed from the condition 04. With respect to the number of substitutions per site condition 01 showed the greatest number could be explained by the rapid recovery of the viral population after the simulation bottleneck effect. In all analyzes the condition 01, always had the highest values among all conditions in relation to indices related to viral population diversity. From the condition 04 the replacement rate shows a decrease in the magnitude of 10E-03 to 10E-04, and it remained at that level until the last point of viral cultivation and consequent extinction of the viral population.
Desenvolvimento de metodologia de analise para estimativa da diversidade genética populacional do HIV-1 através do sequenciamento de nova geração. Uma das características mais marcantes do HIV-1 é a grande diversidade observada entre as cepas que compõem a pandemia de HIV/AIDS. Entretanto, durante sua transmissão, um número extremamente reduzido de partículas é transferido e constituem a infecção no novo hospedeiro, resultando em uma drástica diminuição da diversidade genética da população original. Esse fenômeno é denominado ?bottleneck? e confere um risco em potencial para a sobrevivência da população viral infectante. Decorrido o ?bottleneck? a diversidade genética, que fora perdida, deve ser então recuperada para possibilitar a sobrevivência da população viral no novo ambiente. Neste trabalho foi realizado o desenvolvimento do software TAnDen - Tool for Analysis of Diversity in Viral Populations para realização do alinhamento das short-reads geradas pela plataforma SOLiD. Foi desenvolvido um módulo de análise das short-reads alinhadas utilizando inferência bayesiana com uma distribuição Dirichlet para os estados possíveis na comparação do controle com o dado experimental. O tempo de execução do alinhamento para cada condição experimental com, aproximadamente, 2,7E+07 short-reads, foi em torno de 30 horas em média. Durante o processo de alinhamento foram necessários 1,6 GB de memória RAM. Para o controle e as demais sete condições experimentais foram geradas um total de 214.938.239 milhões (2,1E+08) de short-reads, ou seja, aproximadamente, 1/5 de bilhão short-reads. Do número total de short-reads geradas 144.097.035 milhões (1,4E+08) foram alinhadas e processadas em analises posteriores. Foi analisado o regime mutacional durante o bottleneck e após estabilização da sequência viral utilizando o software TAnDen. A análise de distância variacional progressiva tem como finalidade explorar detalhadamente a principal característica dos cultivos virais sucessivos que geraram os dados analisados. Foi utilizado como base o critério de exclusão de 0,02 para os valores de distância variacional. Apenas 1,51% do total conseguiu atingir o critério de exclusão proposto, sendo os sítios considerados polimórficos em relação a condição adjacente anterior. Foi percebida uma tendência de diminuição linear da distância variacional entre o primeiro e último ponto de cultivo viral, sendo que este pode ser correlacionada com a carga viral e a provável extinção da população viral visualizada a partir da condição 04. Com relação a número de substituições por sítio a condição 01 apresentou o maior numero o poderia ser explicado pela rápida recuperação da população viral após a simulação do efeito bottleneck. Em todas as análises a condição 01, sempre apresentou os maiores valores dentre todas as condições em relação a índices relacionados a diversidade viral populacional. A partir da condição 04 a taxa de substituição apresenta uma queda na ordem de grandeza de 10E-03 para 10E-04, sendo que esta permaneceu neste patamar até o último ponto de cultivo viral e provável extinção da população viral.
URI: http://repositorio.unifesp.br/handle/11600/46200
Other Identifiers: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=2374056
Appears in Collections:Tese de doutorado

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.