Banca de QUALIFICAÇÃO: GIOVANNA ASSUNÇÃO PEREIRA SOARES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : GIOVANNA ASSUNÇÃO PEREIRA SOARES
DATA : 30/04/2026
HORA: 14:00
LOCAL: Auditório do NPITI
TÍTULO:

Abordagens de Aprendizado de Máquina Baseadas em k-mer, Imagens e Transformers de Visão para Representação e Análise de Proteínas e Moléculas


PALAVRAS-CHAVES:

Bioinformática; Encoding de k-mer; Vision Transformer; Aprendizado de Representações; Embeddings de Proteínas e Moléculas; Classificação e Agrupamento.


PÁGINAS: 50
RESUMO:

A representação e análise de sequências biológicas e estruturas moleculares são tarefas fundamentais em bioinformática e quimioinformática. No entanto, métodos tradicionais baseados em alinhamentos de sequências e descritores moleculares apresentam limitações de escalabilidade e dificuldade em capturar relações estruturais e funcionais sutis. Este trabalho investiga abordagens de aprendizado de máquina baseadas em representações de imagens de k-mers e Vision Transformers para a análise de proteínas e moléculas. A abordagem proposta converte sequências biológicas de aminoácidos e strings SMILES moleculares em imagens de tamanho fixo derivadas de matrizes de co-ocorrência de k-mers, as quais são processadas por um Vision Transformer pré-treinado para produzir vetores de embedding discriminativos. Esse pipeline unificado e independente de alinhamento é avaliado sob paradigmas supervisionados e não supervisionados em dois domínios de aplicação. Para proteínas, a classificação supervisionada de clusters dos conjuntos UniRef100 e UniRef90 é realizada utilizando Regressão Logística, Random Forest, k-Nearest Neighbors e XGBoost, enquanto a análise não supervisionada é conduzida com DBSCAN e duas métricas propostas (contaminação e espalhamento) para avaliar a qualidade dos agrupamentos. Para moléculas, a predição de permeabilidade da barreira hematoencefálica é abordada nos conjuntos BBBP e B3DB utilizando classificadores clássicos de aprendizado de máquina e arquiteturas de aprendizado profundo, incluindo MLP, ResMLP, DCN, DCNv2, FT-Transformer e TabNet. Resultados preliminares indicam que os embeddings gerados são eficazes para tarefas de classificação e agrupamento em ambos os domínios. O trabalho planejado inclui a extensão da análise não supervisionada ao domínio molecular.


MEMBROS DA BANCA:
Presidente - 1837240 - MARCELO AUGUSTO COSTA FERNANDES
Interno - 347628 - ADRIAO DUARTE DORIA NETO
Externo ao Programa - 1458979 - ANDRE LUIS FONSECA FAUSTINO - UFRN
Notícia cadastrada em: 13/04/2026 17:30
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2026 - UFRN - sigaa02-producao.info.ufrn.br.sigaa02-producao