Banca de DEFESA: MARIA GRACIELLY FERNANDES COUTINHO

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : MARIA GRACIELLY FERNANDES COUTINHO
DATA : 06/10/2023
HORA: 14:30
LOCAL: meet.google.com/xga-rwdw-qns
TÍTULO:

Stacked Sparse Autoencoder aplicado à classificação do vírus SARS-CoV-2 com base em representações de imagens de sequências genômicas


PALAVRAS-CHAVES:

Aprendizagem Profunda, SARS-CoV-2, COVID-19, Classificação viral, Representações de imagem.


PÁGINAS: 100
RESUMO:

Desde dezembro de 2019, o mundo foi severamente afetado pela pandemia de COVID-19, ocasionada pelo vírus SARS-CoV-2. Em casos como este de nova identificação viral, a elucidação precoce da classificação taxonômica e origem dos genomas de vírus são essenciais para planejamento, contenção e tratamentos. As técnicas de Aprendizagem Profunda vêm sendo utilizadas com sucesso em diversos problemas de classificação viral, associadas ao diagnóstico de infecções virais, metagenômica, análise filogenética, entre outros. Considerando esta motivação, este trabalho tem como proposta gerar um eficiente classificador do genoma viral direcionado ao vírus SARS-CoV-2, utilizando a técnica de Aprendizagem Profunda baseada em Stacked Sparse Autoencoder (SSAE). Para o melhor desempenho do modelo, exploramos a utilização de representações de imagens das sequências completas do genoma como entrada do SSAE para fornecer a classificação do vírus SARS-CoV-2. Para isso, foram explorados dois conjuntos de dados: utilizando representações de imagens baseadas em k-mers e utilizando representações de imagens baseadas em Chaos Game Repesentation (CGR). O conjunto de dados composto por representações de imagens baseadas em k-mers foi aplicado nos experimentos de classificação em diferentes níveis de taxonomia do vírus SARS-CoV-2, enquanto o conjunto de dados baseado em imagens CGR foi aplicado nos experimentos de classificação das variantes de preocupação do SARS-CoV-2. Para os experimentos de classificação taxonômica, a técnica SSAE forneceu ótimos resultados, alcançando acurácias entre 92% e 100% para o conjunto de validação, e entre 98,9% e 100% de acurácia para o conjunto de teste, que aplicou amostras do SARS-CoV-2. Isto indica que o nosso modelo pode ser adaptado para classificar outros vírus emergentes. Para os experimentos de classificação das variantes do SARS-CoV-2 utilizando imagens CGR, a técnica SSAE proporcionou resultados ainda melhores, alcançando acurácia de classificação de 99,9% para o conjunto de validação e 99,8% para o conjunto de teste. Por fim, os resultados indicaram a aplicabilidade desta técnica de aprendizagem profunda em problemas de classificação de genomas.


MEMBROS DA BANCA:
Presidente - 1837240 - MARCELO AUGUSTO COSTA FERNANDES
Interno - 347628 - ADRIAO DUARTE DORIA NETO
Interno - 1153006 - LUIZ AFFONSO HENDERSON GUEDES DE OLIVEIRA
Externa à Instituição - ADRIANA TAKAHASHI - UERN
Externo à Instituição - LEONARDO ALVES DIAS - Warwick
Notícia cadastrada em: 04/09/2023 15:24
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2024 - UFRN - sigaa08-producao.info.ufrn.br.sigaa08-producao