Metaproteômica computacional de tecidos humanos para identificação de alvos moleculares de interesse clínico
Proteômica, meta-análise, biomarcadores, antígenos, câncer/ testículo.
O desenvolvimento de tecnologias de sequenciamento de próxima geração permitiu uma melhor caracterização do genoma e do transcriptoma humano. A proteômica também passou por grandes desenvolvimentos tecnológicos na última década em termos de sensibilidade e capacidade de sequenciamento, mas ainda não se encontra no mesmo nível que a genômica. O perfil de todo o ambiente tumoral quase sempre foi baseado em análises de DNA e RNA. Entretanto, o estudo do genoma e do transcriptoma não são suficientes para elucidar mecanismos moleculares de uma célula, pois a função ocorre em sua maioria a nível proteico. Além disso, a quantidade de mRNA em uma célula não é necessariamente proporcional ao nível de proteína codificado,. O avanço das tecnologias proteômicas permitiu utilizar o proteoma para explorar a caracterização molecular do câncer, bem como para revelar novos biomarcadores de proteínas, promovendo à medicina personalizada contra o câncer. Uma dificuldade é que enquanto estudos transcriptômicos trabalham com centenas de amostras de células ou tecidos, os estudos proteômicos trabalham com poucas amostras. Para solucionar essa problemática, este trabalho sugere a integração de dados proteômicos de diferentes projetos disponibilizados em repositórios públicos, possibilitando uma visão mais global dasamostras em análise. O objetivo deste trabalho é realizar uma meta-análise computacional de dados proteômicos de tecidos humanos, para identificar proteínas como alvos moleculares de interesse clínico para o câncer. Foram analisados aproximadamente 10 Tb de dados proteômicos, contendo mais de 500 amostras de tecidos saudáveis, tumores coletados de pacientes e de linhagens celulares imortalizadas usadas como modelo em câncer. Após a integração dos dados proteômicos, as amostras tumorais foram agrupadas de acordo com os tecidos as quais elas pertenciam, com o intuito de amplificar o número de amostras por tecido. O agrupamento revelou 369 amostras tumorais obtidas de 8 diversos tipos de câncer. As amostras do tecido normal também foram consideradas, como controle, totalizando 140 amostras. Para analisar a expressão das proteínas no total de amostras, foi utilizada uma técnica estatística, conhecida como análise de componentes principais (PCA). Notavelmente, observou-se que o agrupamento por tecido tumoral não foi uma estratégia eficiente para câncer de mama e para melanoma, possivelmente em razão da heterogeneidade desses tumores. Finalmente, para realizar a identificação de proteínas como alvos moleculares de interesse clínico, as análises subsequentes focaram-se em pelo menos três aspectos: caracterização de antígenos de câncer/testículo (CTAs), fatores de transcrição e upsetrams ORFs. Até agora apenas CTAs foram caracterizados. Com a finalidade de identificar se CTAs estavam expressos a nível proteico, CTAs anteriormente preditos em trabalho transcriptômicos foram utilizados. Como resultado, foram identificados 222 ACTs a nível proteico, dos quais 19 eram diferencialmente expressos em amostras cancerígenas em relação a amostras saudáveis. Em conclusão, a meta-análise computacional realizada nesse trabalho apresenta potencial para permitir futuros avanços na caracterização de metaproteomas tumorais e consequentemente, na identificação de biomarcadores de proteínas para o tratamento contra o câncer.