Banca de QUALIFICAÇÃO: MARIA BÁRBARA BORGES DE SANTANA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : MARIA BÁRBARA BORGES DE SANTANA
DATA : 30/05/2026
HORA: 09:00
LOCAL: Google Meet
TÍTULO:

Montagem de transcriptomas e descoberta de lncRNAs a nível de isoformas via sequenciamento de leituras longas


PALAVRAS-CHAVES:

lrRNA-seq. lncRNA. Isoformas. Nextflow.


PÁGINAS: 52
RESUMO:

Os RNAs longos não codificantes (lncRNAs) são reguladores cruciais da expressão gênica; todavia, sua identificação precisa permanece desafiadora devido à baixa expressão, grande diversidade estrutural e complexidade inerente de suas isoformas. Embora o sequenciamento de RNA de leitura longa (lrRNA-seq) tenha surgido como uma solução poderosa para resolver transcritos full-length e arquiteturas complexas de isoformas, o campo carece de estruturas computacionais padronizadas, reproduzíveis e de ponta a ponta, especificamente otimizadas para a descoberta de lncRNAs a partir de dados brutos de sequenciamento. Diante deste contexto, desenvolvemos LongNonCoder, um fluxo de trabalho em Nextflow totalmente automatizado e escalável, projetado para a descoberta e caracterização de lncRNAs a nível de isoformas com alta confiança, operando diretamente a partir de leituras brutas de lrRNA-seq. A ferramenta integra subfluxos sequenciais para controle de qualidade, alinhamento splice-aware, montagem e quantificação do transcriptoma, identificação de lncRNAs, caracterização estrutural detalhada e visualização de dados. LongNonCoder permite que o usuário defina diversos parâmetros de execução, e incorpora ferramentas como NanoComp, MultiQC, minimap2, Bambu, GffCompare, RNAmining e biomaRt. Uma funcionalidade central é sua estratégia de classificação em duas camadas, que avalia novas isoformas com base em características estruturais e potencial codificador independentemente do biotipo de seu locus parental, garantindo a classificação individualizada de lncRNAs com alta confiança e resolvendo tanto isoformas "tipo mRNA" (mRNA-like) quanto isoformas não canônicas. Para validar a ferramenta, realizamos um benchmarking a partir de conjuntos de dados públicos de leituras brutas de sequenciamento Nanopore e leituras não-quiméricas full-lentgh de sequenciamento PacBio, demonstrando alta precisão (>85%) e a capacidade de montar o transcriptoma de forma robusta a nível de isoformas. O pipeline isolou com sucesso subtipos estruturais distintos de lncRNAs, incluindo novas isoformas de genes já conhecidos, antisense, intergênicas e eventos de retenção de íntrons, separando-as efetivamente de históricos canônicos. Além disso, o perfil de recursos do fluxo de trabalho destaca sua escalabilidade e execução eficiente dentro de uma estrutura em conformidade com os princípios FAIR. Por fim, ao gerar matrizes estruturais e de expressão totalmente curadas e prontas para análises downstream, LongNonCoder padroniza a transição de dados brutos de lrRNA-seq para a investigação profunda da arquitetura transcriptomica de lncRNAs, oferecendo uma base confiável, reproduzível, completa e flexível para a pesquisa de RNAs reguladores.


MEMBROS DA BANCA:
Externo à Instituição - GLORIA REGINA FRANCO - UFMG
Interno - 1507794 - RODRIGO JULIANI SIQUEIRA DALMOLIN
Interna - ***.117.554-** - THAIS GAUDENCIO DO REGO - UFPB
Presidente - ***.739.204-** - VINICIUS RAMOS HENRIQUES MARACAJA COUTINHO - USP
Notícia cadastrada em: 20/05/2026 12:10
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2026 - UFRN - sigaa13-producao.info.ufrn.br.sigaa13-producao