Banca de DEFESA: DÉBORA VIRGÍNIA DA COSTA E LIMA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : DÉBORA VIRGÍNIA DA COSTA E LIMA
DATA : 24/07/2025
HORA: 08:00
LOCAL: meet.google.com/cbr-pkcn-few
TÍTULO:

Análise de Bioinformática e Aprendizado de Máquina na Busca por Biomarcadores em Carcinoma de Células Escamosas de Pulmão.


PALAVRAS-CHAVES:

Câncer de Pulmão, Análise de sobrevida, Aprendizado de máquina, Assinatura Gênica, Inteligência Artificial.


PÁGINAS: 57
RESUMO:

O câncer de pulmão é a principal causa de morte por câncer em todo o mundo, independentemente do sexo. Dentre os tipos de câncer de pulmão, o Carcinoma de Células Escamosas de Pulmão (LUSC) é o segundo tipo mais comum, caracterizado por diagnóstico em estágios avançados, mau prognóstico e alta associação com tabagismo. Devido à gravidade do câncer de pulmão, é essencial compreender seus mecanismos moleculares. Nesse contexto, este estudo utiliza dados moleculares objetivando a busca por biomarcadores em carcinoma de células escamosas de pulmão. O trabalho utiliza dados moleculares e clínicos para implementar pipelines de bioinformática, aprendizado de máquina, visando prever o prognóstico dos pacientes e obter uma assinatura genética do LUSC para progressão tumoral. Analisamos dados clínicos e moleculares do projeto LUSC-TCGA e realizamos análises de expressão diferencial (DEA) comparando tecidos normais com tecidos tumorais. Com base nos genes selecionados pela DEA, os pacientes foram divididos em três grupos, seguidos por etapas de seleção de características e classificação. A partir disso, foi possível obter resultados de classificações próximas a 70% de acerto para os três clusters. Por fim, também realizamos uma análise de enriquecimento funcional. A análise revelou no cluster 2 genes enriquecidos como CDT1, CENPI e NLGN1, associados ao processo molecular EMT (transição epitelial-mesenquimal). Nossa abordagem facilitou a identificação de genes que são biologicamente relevantes para o processo de desenvolvimento do LUSC, (como os genes ALDH3B1, C7, FAM83A, FOSB, GCGR, BMP7, PPP1R27 e AQP1) e genes relevantes para predição da sobrevivência do paciente e possíveis alvos terapêuticos para LUSC (como os genes FAM83A, CAV1, TNS4, EIF4G1, TFAP2A, GCGR e PPP1R27). Dando sequência, foram utilizados os dados de expressão dos conjuntos de genes selecionados nos clusters, combinados com seleção de características, balanceamento de dados, aprendizado de máquina e inteligência artificial explicável (XAI) para identificar uma assinatura com possíveis biomarcadores relacionados ao estadiamento. Os métodos empregados demonstraram métricas de classificação robustas, com o classificador random forest alcançando a maior precisão (0,91). O uso de técnicas de balanceamento de dados e seleção de características provou ser crucial no processo de classificação. Além disso, foi possível identificar os 16 genes mais relevantes selecionados pelo random forest usando o método SHapley Additive Explanations (SHAP). Entre eles, três genes (MYOSLID, IMPDH1P8 e COL9A3) foram escolhidos por todos os classificadores bem-sucedidos, posicionando-se como potenciais biomarcadores de estadiamento e possíveis alvos terapêuticos moleculares para LUSC.


MEMBROS DA BANCA:
Presidente - 1365498 - BEATRIZ STRANSKY FERREIRA
Interno - 3063244 - TETSU SAKAMOTO
Externo à Instituição - ANDRE MAURICIO RIBEIRO DOS SANTOS - UFPA
Externo à Instituição - ANDRÉ LUÍS FONSECA FAUSTINO - UFPA
Externo à Instituição - TAFFAREL MELO TORRES - UFERSA
Notícia cadastrada em: 11/07/2025 11:34
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2026 - UFRN - sigaa02-producao.info.ufrn.br.sigaa02-producao