Análise por transcriptogramas para a transição epitélio-mesenquimal
Transição Epitélio-Mesenquimal (EMT); Single-Cell RNA-seq; Células MCF10A; Tratamento com TGF-β1; Correção de efeito de batch; Normalização da expressão gênica; Análise de transcriptograma; Interações proteína-proteína; Análise de Componentes Principais (PCA); Expressão gênica diferencial; Clusterização por co-expressão; Padrões temporais de expressão gênica
A Transição Epítelio-Mesenquimal (EMT) é um processo biológico essencial para o desenvolvimento embrionário, cicatrização tecidual e progressão tumoral. Este estudo investiga as alterações transcricionais durante a EMT utilizando dados de Single-Cell RNA-seq de células MCF10A tratadas com TGF-β1 em diferentes períodos. Os dados foram retirados do estudo publicado na PNAS (2021) (DOI: 10.1073/pnas.2102050118). Os dados foram coletados em dois batchs experimentais para capturar variações temporais: Batch 1: Dias 0, 4 e 8 de tratamento. Batch 2: Dias 0, 1, 2 e 3 de tratamento. A presença de dois batchs exigiu correção de efeitos de batch, feita pela normalização das expressões gênicas entre os dias zero de ambos os lotes. A normalização envolveu a divisão dos valores pelo total de leituras da célula, seguida pela aplicação da razão entre as médias dos controles. A análise foi realizada utilizando o pacote Transcriptogramer, que projeta perfis de expressão gênica em uma lista ordenada de proteínas baseada em interações proteína-proteína. O método permite a identificação de padrões transcricionais contínuos e o agrupamento de genes co-expressos. A Análise de Componentes Principais (PCA) foi utilizada para visualizar variações na expressão gênica ao longo da EMT, sem escalonamento (scale=FALSE), preservando a variação biológica original. Foram gerados transcriptogramas para representar a dinâmica da EMT, identificando genes diferencialmente expressos e possíveis estágios parciais do processo. Os resultados obtidos até o momento sugerem padrões distintos de expressão gênica entre os batchs, reforçando a importância da correção de batch effects. A reconstrução dos transcriptogramas revelou agrupamentos funcionais, destacando genes chave na EMT. Entre as próximas etapas, estão a reconstrução dos transcriptogramas para algumas amostras, a seleção dos genes mais variáveis ao longo do tempo e a clusterização por co-expressão, visando definir uma lista de genes que melhor descrevem a EMT nesse contexto. Além disso, buscamos obter uma descrição detalhada da evolução da expressão gênica ao longo da EMT que possa servir como base para modelos computacionais de órgãos e tecidos virtuais, permitindo futuras aplicações em simulações biomédicas.