Identificação de Sequências Virais da Subfamília Orthocoronavirinae em Metagenomas e Transcriptomas Humanos
Os coronavírus (CoVs), da família Coronaviridae, são capazes de infectar uma variedade de hospedeiros, produzindo sintomas e doenças que variam do resfriado comum a situações mais graves ou fatais. Antes do surgimento do SARS-CoV-2 (do inglês, Severe Acute Respiratory Syndrome Coronavirus 2), causador da COVID-19 (do inglês, Coronavirus Disease 2019), apenas alguns CoVs eram conhecidos por causar doenças em humanos, dos quais o SARS-CoV e o MERS-CoV eram os únicos vírus da família associados a uma alta taxa de mortalidade. É possível que o surgimento de novos vírus dessa família possa ocorrer devido à coinfecção de múltiplos CoVs em um mesmo hospedeiro natural, favorecendo a recombinação genética, e a altas taxas de mutações que ocorrem devido à instabilidade das RNA polimerases dependentes de RNA. Considerando a importância de melhor investigar o comportamento desses vírus, o presente projeto tem como objetivo identificar sequências virais da família Coronaviridae no metagenoma de seus hospedeiros utilizando ferramentas de bioinformática (fastp, Kaiju, BWA e SPAdes). Espera-se que com essa análise seja possível a identificação de informações biológicas relevantes, taxonômicas e genéticas (diversidade de sequências), que possam melhor descrever a relação vírus-hospedeiro. Existem 46 CoVs distribuídos em cinco gêneros e que estão associados a centenas de hospedeiros. Destes, apenas 68 apresentam genomas de referência e utilizamos apenas essas espécies para fazer uma pesquisa por sequências de domínio público no SRA (Sequence Read Archive/NCBI), utilizando palavras-chave para delimitar a busca. Dessa forma, encontramos 24367 produtos de sequenciamento pertencentes a vários projetos. Na primeira etapa do trabalho, contemplando a análise de controle de qualidade (fastp 0.20.1) e a classificação taxonômica (Kaiju 1.7.4), foram encontradas 836 amostras positivas para CoVs, das quais todas foram negativas quando submetidas à contraprova por outra ferramenta (BWA). Esses resultados sugerem que as amostras investigadas não apresentavam coronavírus, apenas sequências conservadas e similares entre os organismos, o que foi superestimado pela ferramenta Kaiju.