Nova proposta de representação de genoma viral aplicada na classificação do SARS-CoV-2 com aprendizagem profunda
COVID-19, SARS-CoV-2, Representação genômica, Processamento de sinais genômicos, Aprendizagem profunda.
Em dezembro de 2019, o primeiro caso de COVID-19 foi descrito em Wuhan, na China, e em abril de 2021, já haviam 136 milhões de casos confirmados. Devido a rápida propagação do vírus, esforços vêm sendo
realizados pela comunidade científica para o desenvolvimento de técnicas de classificação viral do SARS-CoV-2. Neste trabalho, foi desenvolvido, utilizando um conjunto de técnicas de Processamento de Sinais Genômicos, uma nova proposta de representação dos dados genéticos de amostras de seis vírus da família Coronaviridae, a qual pertence o vírus SARS-CoV-2. Em seguida, o mapeamento realizado foi empregado a uma arquitetura de aprendizagem profunda para a classificação das amostras virais, obtendo acurácia de 94% e 91% para os tamanhos 64 e 128 da redimensão das sequências, respectivamente, além de obter 100% de sensibilidade para os vetores com tamanho 64. Por fim, dada a taxa de mutação de vírus de RNA, novas variantes surgiram e com elas a possibilidade de aumento de casos. Foi então realizado, utilizando a técnica desenvolvida, uma análise da evolução de quatro variantes de preocupação em três procedimentos de classificação viral, os resultados obtidos auxiliam na compreensão das relações filogenéticas entre as variantes.