Title: | Genômica comparativa de isolados de Leishmania infantum de Santa Catarina e Rio Grande do Norte |
Author: | Kawagoe, Eric Kazuo |
Abstract: |
Leishmania infantum é um protozoário unicelular flagelado e parasita obrigatório, que tem como reservatório humanos e canídeos. Este parasito é o agente causador de leishmaniose visceral nas Américas, considerada uma antropozoonose tropical negligenciada. A doença acomete órgãos linfoides como medula óssea, fígado e baço, podendo causar sintomas como febre, perda de peso, hepatoesplenomegalia e anemia. As ciências ômicas podem atuar em estudos para elucidar mecanismos referentes à biologia de parasitos ou para identificar regiões que apresentam, ou não, similaridade entre diferentes organismos. No contexto de similaridade se enquadram estudos de genômica comparativa, que possibilitam identificar, por exemplo, regiões compartilhadas, genes e proteínas essenciais presentes no genoma de organismos de uma mesma espécie. O objetivo deste trabalho foi realizar a montagem, anotação funcional e análise comparativa a partir de dados de sequenciamento de segunda geração de amostras de L. infantum coletadas em Santa Catarina e obtidas de bancos de dados públicos para o Rio Grande do Norte. Ambas as etapas de montagem e anotação foram realizadas utilizando dados públicos obtidos do TriTrypDB da cepa JPCM5 de L. infantum como referência. As montagens preliminares foram realizadas pelo programa SPAdes e, então, refinadas pelos programas SSPACE e GapFiller, para ordenação de scaffolds e preenchimento de gaps, respectivamente. A ordenação de scaffolds em cromossomos foi realizada pelo programa SAMtools a partir de alinhamentos contra a referência e refinado pelos programas BWA-MEM e Pilon. A predição gênica foi realizada pelo preditor AUGUSTUS e a anotação funcional pela pipeline AnnotaPipeline. As montagens finais apresentaram média de 32,6 Mb totais e 2.790,49 bases não identificadas distribuídas em 36 scaffolds contíguos, o que representa 99,5% do tamanho do genoma de referência. As montagens apresentaram média de 8.695 proteínas preditas e anotadas, com média de 2.983 proteínas anotadas como hipotéticas e sem anotação funcional. A partir do resultado destas montagens e predições, o programa OrthoFinder foi utilizado para realizar a análise de ortologia entre todas as proteínas anotadas, mas o perfil gênico se mostrou conservado e sem proteínas específicas, que garantem vantagem evolutiva, para uma única amostra. A anotação funcional com base em termos ontológicos permitiu identificar processo biológicos clássicos para as amostras de Santa Catarina, mesmo sem a presença do vetor clássico no município. Polimorfismos de base única foram detectados pelo programa FreeBayes e seus impactos foram preditos pelo programa SnpEff. Polimorfismos não-sinônimos de alto impacto não foram frequentes e apareceram em poucas amostras. Por fim, este trabalho permitiu uma análise comparativa de diversos genomas altamente sintênicos com base em montagem e anotação de genomas, gerando informações funcionais que podem atuar em conjunto com estudos mais tradicionais de identificação e perfil de variantes. Abstract: Leishmania infantum is an intracellular parasite that infects mammalian hosts and sandflies. It is the main etiological agent for visceral leishmaniasis, which is considered a neglected tropical disease, in the Americas. Visceral leishmaniasis affects mainly lymphoid organs and manifests in hepatosplenomegaly, weight loss, fever and anaemia. Omics refers to a subfield in bioinformatics focused on biological sequences which can be employed in studies for biological insights. Comparative genomics can involve sequence similarity for genomic discoveries, such as syntenic regions and gene/protein discovery within a species. We employed comparative genomics in assembled and annotated genomes, generated from short reads, obtained in Santa Catarina and from public databases. Both genome assembly and annotation used the current reference genome from TriTrypDB, Leishmania infantum JPCM5. Draft assemblies were generated by SPAdes, and submitted to SSPACE and GapFiller for scaffolding/gap filling. Scaffolds were aligned to the reference genome and merged into polished chromosomes through BWA-MEM and Pilon. AUGUSTUS was used for gene prediction and AnnotaPipeline obtained functional annotations. Final assemblies presented 36 scaffolds, and an average of 32.6 Mb and 2,790.29 unidentified nucleotides. Gene predictions presented and average of 8,695 annotated proteins with 2,983 hypothetical proteins without functional annotations. Functional annotations, based on ontology, allowed the identification of classical biological processes despite the absence of classical vectors in Santa Catarina. Annotated proteins were submitted to OrthoFinder for orthology inference, which resulted in conserved gene profiles throughout all samples. Single nucleotide polymorphisms were were detected by FreeBayes and annotated by SnpEff for potential impacts. High impact non-synonymous mutations were not frequent and not dispersed in multiple samples. In conclusion, comparative genomics resulted in highly syntenic genomes and functional annotations that could be incorporated in traditional studies involving variant analysis. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia e Biociências, Florianópolis, 2021. |
URI: | https://repositorio.ufsc.br/handle/123456789/231108 |
Date: | 2021 |
Files | Size | Format | View |
---|---|---|---|
PBTC0334-D.pdf | 6.391Mb |
View/ |