Banca de QUALIFICAÇÃO: PITÁGORAS DE AZEVEDO ALVES SOBRINHO

Uma banca de QUALIFICAÇÃO de DOUTORADO foi cadastrada pelo programa.
DISCENTE : PITÁGORAS DE AZEVEDO ALVES SOBRINHO
DATA : 28/07/2025
HORA: 10:30
LOCAL: Google Meet
TÍTULO:

Anotação Funcional de Proteínas aprimorada pela Classificação Hierárquica e Modelos de Linguagem

Protein Functional Annotation Enhanced by Hierarchical Classification and Language Models


PALAVRAS-CHAVES:

Previsão de Funções; Classificação Multi-label; Deep Learning; Classificação Hierárquica; Banco de Dados


PÁGINAS: 30
RESUMO:

Dezenas de milhares de proteínas diferentes são produzidas pelo corpo humano, desempenhando as mais diversas funções. Essa função molecular é determinada por sua estrutura, características físico-químicas, meio e contexto biológico. Apesar dos avanços recentes na predição da estrutura de proteínas, a identificação precisa de suas funções moleculares continua limitada. O trabalho explora o uso de modelos de linguagem para proteínas (PLMs) — baseados na arquitetura Transformer — combinados com técnicas de classificação hierárquica e multirrótulo, visando capturar a complexidade semântica do Gene Ontology (GO). Além do uso de modelos como ProtT5, Ankh e ESM2, a pesquisa propõe integrar embeddings proteicos pré-calculados e anotações validadas experimentalmente em um banco de dados unificado. Esse banco, o Protein Dimension DB, foi recentemente publicado e já está sendo utilizado pela comunidade. Foram realizados benchmarkings de diferentes conjuntos de características para previsão de funções moleculares, os quais demonstraram a importância da combinação de múltiplos modelos e informações taxonômicas. Os resultados dos benchmarkings foram utilizados para guiar o desenvolvimento de uma nova ferramenta para previsão de funções moleculares chamada MF Swarm. Testes com dados validados experimentalmente demonstram desempenho promissor na previsão de 1325 funções moleculares. Essa proposta metodológica visa fornecer uma ferramenta precisa e escalável para auxiliar a pesquisa biomédica, o entendimento funcional de proteínas recém-sequenciadas e o desenvolvimento de aplicações farmacológicas.


MEMBROS DA BANCA:
Presidente - ***.795.577-** - WILFREDO BLANCO FIGUEROLA - UFRN
Interno - 1513597 - JOAO PAULO MATOS SANTOS LIMA
Interno - 3063244 - TETSU SAKAMOTO
Notícia cadastrada em: 18/07/2025 20:45
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2026 - UFRN - sigaa02-producao.info.ufrn.br.sigaa02-producao