Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos

DSpace Repository

A- A A+

Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos

Show full item record

Title: Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
Author: Maia, Guilherme Augusto
Abstract: Trypanosoma rangeli é um protozoário que ocorre nas Américas, que compartilha aspectos genéticos, morfológicos e antigênicos com T. cruzi, agente etiológico da Doença de Chagas. Apesar das características compartilhadas e da proximidade filogenética com o T. cruzi, o T. rangeli não é considerado patogênico para seu hospedeiro mamífero. Em comparação com o T. cruzi, o genoma do T. rangeli apresenta um número menor de cópias de genes que codificam para proteínas de superfície, as quais são possíveis fatores de virulência associados aos processos de invasão celular e evasão do sistema imune. Neste contexto, o objetivo do presente estudo foi gerar uma nova versão do genoma de T. rangeli (cepa SC58), combinando dados obtidos através de diferentes tecnologias de sequenciamento, e realizar um estudo comparativo de aspectos estruturais e funcionais com outras espécies de tripanosomatídeos. Para tal, foi realizada uma nova montagem genômica de T. rangeli utilizando dados de sequenciamento do tipo long reads e short reads. As etapas de predição gênica e anotação gênica foram realizadas utilizando-se o programa AnnotaPipeline, que utilizou dados experimentais de transcriptômica e proteômica para validar as predições gênicas de T. rangeli. Para a anotação gênica automática por análise de similaridade, foram utilizadas sequências depositadas nos bancos de dados do SwissProt e do TriTrypDB, também sendo realizadas anotação funcional, análise de evidência de transcrição e de evidência de tradução. Em seguida, foi realizada uma análise de homologia entre as CDS descritas na versão 2 do genoma de T. rangeli, as CDS de T. brucei (cepa TREU927) e de T. cruzi (cepa CL Brener Esmeraldo-like), assim como as CDS preditas e anotadas na montagem do genoma de T. conorhini (cepa 025E). Os resultados mostram que a versão 2 do genoma de T. rangeli SC58 é mais contígua, menos fragmentada e abrange 99,95% de toda a informação contida na descrição original do genoma do parasito. Nesta versão, o conteúdo genômico repetitivo de T. rangeli é representado por uma fração de 13,53% de elementos repetitivos estruturais e por apenas 2,74% de elementos repetitivos funcionais. Os elementos estruturais mais proeminentes são as repetições intercaladas (compostas principalmente por retroelementos do tipo LTRs e LINEs) e as repetições simples (com uma maior repetição de motivos de di-nucleotídeos). Os elementos funcionais que mais se destacam são os genes multicópias das famílias das sialidases e GP63, representando 44,67% e 38,42% do total identificado, respectivamente. A devida identificação destes elementos repetitivos no genoma possibilita um melhor entendimento sobre os processos de adaptação e evolução desses organismos. A atribuição de função por meio de anotação automática foi obtida para 73,12% das CDS preditas, restando apenas 26,88% das CDS anotadas como hipotéticas. Os resultados obtidos da análise de homologia reforçam a existência de um genoma central compartilhado entre tripanosomatídeos, representado por um agrupamento de 4.156 grupos de CDS ortólogas das quatro espécies estudadas. A versão 2 do genoma de T. rangeli SC58 apresenta um conjunto de CDS anotadas como hipotéticas a serem caracterizadas, principalmente as ortólogas com as demais espécies de tripanosomatídeos.Abstract: Trypanosoma rangeli is a protozoan that occurs in the Americas, sharing genetic, morphological, and antigenic aspects with T. cruzi, the etiological agent of Chagas disease. Despite the shared characteristics and phylogenetic proximity to T. cruzi, T. rangeli is not considered pathogenic to its mammalian host. Compared to T. cruzi, the genome of T. rangeli presents a smaller number of copies of genes encoding surface proteins, which are potential virulence factors associated with cellular invasion and immune system evasion processes. In this context, the aim of this study was to generate a new version of the T. rangeli genome (SC58 strain), combining data obtained through different sequencing technologies, and to conduct a comparative study of structural and functional aspects with other trypanosomatid species. To achieve this, a new genomic assembly of T. rangeli was performed using long-read and short-read sequencing data. Gene prediction and gene annotation steps were carried out using the AnnotaPipeline software, which used experimental transcriptomic and proteomic data to validate gene predictions of the genome. For automatic gene annotation by similarity analysis, sequences deposited in the SwissProt and TriTrypDB databases were used, along with functional annotation, transcription evidence analysis, and translation evidence analysis. Subsequently, a homology analysis was conducted among the CDS described in version 2 of the T. rangeli genome, the CDS of T. brucei (TREU927 strain) and T. cruzi (CL Brener Esmeraldo-like strain), as well as predicted and annotated CDS of the T. conorhini (025E strain) genome assembly. The results show that the version 2 of the T. rangeli SC58 genome is more contiguous, less fragmented, and covers 99.95% of all information contained in the original description of the parasite genome. In this version, the repetitive genomic content of T. rangeli is represented by a fraction of 13.53% structural repetitive elements and only 2.74% functional repetitive elements. The most prominent structural elements are interspersed repeats (composed mainly of LTRs and LINEs retroelements) and simple repeats (with a higher repetition of di-nucleotide motifs). The most representative functional elements are the multicopy genes of the sialidase and GP63 families, representing 44.67% and 38.42% of the total identified, respectively. The proper identification of these repetitive elements in the genome allows a better understanding of the processes of adaptation and evolution of these organisms. Function assignment by means of automatic annotation was obtained for 73.12% of the predicted CDS, leaving only 26.88% of the CDS annotated as hypothetical. Results obtained from the homology analysis reinforce the existence of a shared core genome among trypanosomatids, represented by a cluster of 4,156 groups of orthologous CDS from the four species studied. Version 2 of the T. rangeli SC58 genome presents a set of CDS annotated as hypothetical to be characterized, mainly the orthologs with the other trypanosomatid species.
Description: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia e Biociências, Florianópolis, 2023.
URI: https://repositorio.ufsc.br/handle/123456789/254605
Date: 2023


Files in this item

Files Size Format View
PBTC0374-T.pdf 4.046Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar