MODELO PARA IDENTIFICAÇÃO DE GENES BIMODAIS ASSOCIADOS AO PROGNÓSTICO NO CÂNCER
câncer; expressão genética; distribuição bimodal; Modelo de Mistura Gaussiana; análise de sobrevivência
Nas últimas décadas o interesse biológico em compreender a regulação gênica, tem levado a descobertas de genes tumorais com expressões diferenciadas em subgrupos de pacientes. Estes genes possuem um perfil bimodal de distribuição dos valores de expressão, o que têm despertado a atenção para investigar os padrões de desenvolvimento e de sua funcionalidade. Uma das grandes limitações dos métodos tradicionais está em identificar subgrupos homogêneos, que representam os distintos níveis do valor de expressão gênica para o mesmo tumor. Neste trabalho, desenvolvemos um método que seleciona genes candidatos ao padrão de bimodalidade a partir da função densidade de probabilidade dos valores de expressão, permitindo minimizar a heterogeneidade interna dos picos. Analisamos 25 tipos de tumores e encontramos 96 genes com amostras consistentes quanto ao prognóstico de sobrevida, com p-valor ≤ 0,01. Como contribuição apresentamos um método com o código livre, que possibilita reduzir os níveis de variabilidade interna dos grupos e que relaciona o padrão de expressão bimodal com o prognóstico de sobrevida. Assim, acreditamos que a utilização do método poderá ser útil na avaliação do padrão bimodal de expressão gênica e na descoberta de novos biomarcadores clínicos para diferentes tipos de câncer.