O Uso de Redes Neurais Artificiais na Análise de Dados de Câncer de Pulmão
Aprendizado de máquina, Inteligência artificial, Dados Oncológicos.
O câncer de pulmão é uma doença de grande importância, representando a principal causa de morte com câncer, e possuindo além de altos níveis de incidência, alta mortalidade. Assim como outros tipos de câncer, pode ocorrer por diversas causas de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. Os dados clínicos e moleculares obtidos de pacientes resultam em um grande volume de dados, logo a realização de etapas de pré-processamento e análises de bioinformática trazem benefícios na descoberta de informação e seleção de dados. As etapas deste estudo são: obtenção de dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise de bioinformática, organização e pré-processamento dos dados, e desenvolvimento de redes neurais usando como entrada os genes frequentemente mutados para cada coorte. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank, além disso, as variáveis clínicas estatisticamente relevantes no modelo de riscos proporcionais de Cox foram raça e presença de metástases. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 35 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração de redes com 100% de acurácia, por meio de validação cruzada, identificando, de acordo com as mutações, se o paciente estava vivo ou morto. Os modelos desenvolvidos consistiram em redes MLP (perceptron multicamadas) profundas usando uma técnica de dropout e o algoritmo de Adam como otimizador de treinamento. O método de escolha de genes com mutações frequentes associadas ao uso de deep learning permite predizer a sobrevida de pacientes com câncer de pulmão.