Técnicas de aprendizagem profunda aplicadas à classificação genômica viral associada ao SARS-CoV-2
Aprendizagem Profunda, SARS-CoV-2, COVID-19, Classificação viral
Nos últimos meses, o mundo foi severamente afetado pela pandemia de COVID-19, ocasionada pelo vírus SARS-CoV-2, identificado pela primeira vez em dezembro de 2019 em Wuhan, China. Em março de 2020, a Organização Mundial da Saúde elevou o nível de contaminação à pandemia de COVID-19, devido à sua disseminação geográfica por diversos países. Um dos campos de pesquisa da área de bioinformática consiste na análise de sequências genômicas. Em casos como este de nova identificação viral, a elucidação precoce da classificação taxonômica e origem dos genomas de vírus são essenciais para planejamento, contenção e tratamentos. As técnicas de Aprendizagem Profunda vêm sendo utilizadas com sucesso em diversos problemas de classificação viral, associadas ao diagnóstico de infecções virais, metagenômica, análise filogenética, entre outros. Sendo assim, este trabalho tem como proposta gerar eficientes classificadores do genoma viral direcionados ao vírus SARS-CoV-2, utilizando técnicas de Aprendizagem Profunda, como Stacked Sparse Autoencoder (SSAE) e Redes Neurais Convolucionais (CNN). Experimentos relacionados a outros datasets de vírus também serão propostos. Para auxiliar neste processo, também serão geradas assinaturas digitais para os vírus, tendo em vista prover relevantes representações numéricas para as sequências de nucleotídeos. Os resultados preliminares aqui apresentados com a utilização da técnica SSAE aplicada às sequências de genomas de vírus, coletadas indicam a viabilidade desta proposta.